行き当たりばたりでプログラムを作っています
ネタがないので、作成中の例のプログラムについて書いてみる。
やっとHTMLを解析してXMLDocumentに入れられるようになった。途中で、もうチョイいい方法が浮かんだのだけれど、とりあえず今のままで完成させてみた。正しく入ったかはまだ検証してない・・・。文字解析は苦手なので、汚いプログラムになってしまった。
しかし、ニコ動のHTMLは、一部正しくない&汚い。
例えば、検索結果ページで<tr>タグが閉じていないところがあったり<table>タグの中に<table>タグが入っていたり、動画ページで<script>タグ内でコメント(<!-- ~ -->)でスクリプトをくくっていないとか。
なんだかんだで、ニコ動用HTML DOMになってしまったような気がする。
・・・まあいいや。必要な情報が取得できれば。(確認していないからちゃんととれるか心配だ。近いうちに書き換えよう・・・)
そして謎の仕様を書いておく。
ファイルの先頭9バイト:ヘッダ部分
・'FLV'固定:3バイト(46 4C 56)
・1バイト(01)
・1バイト(05)
・4バイト(00 00 00 09)
特に見ておく必要はない。
以降は、データ部分。
previous tag size:4バイト(00 00 00 00)
tag type:1バイト(0x08:Audio、0x09:Video、0x12:META)
body length:3バイト
time stamp:3バイト
time stamp extended:1バイト
stream id:3バイト
データ:body length分のデータ
これの繰り返し。
Audioのデータは細切れのように短いデータ長のものが、何個も散在している。
明日、C#で抽出・結合するプログラムを書いてみようと思う。(謎)
« 読了:神無き世界の英雄伝 1 | トップページ | 行き当たりばたりなプログラム:FLVからMP3をブッコ抜く »
コメント