2024年10月
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31    
無料ブログはココログ

 

« 読了:神無き世界の英雄伝 1 | トップページ | 行き当たりばたりなプログラム:FLVからMP3をブッコ抜く »

2008年8月20日 (水)

行き当たりばたりでプログラムを作っています

ネタがないので、作成中の例のプログラムについて書いてみる。

やっとHTMLを解析してXMLDocumentに入れられるようになった。途中で、もうチョイいい方法が浮かんだのだけれど、とりあえず今のままで完成させてみた。正しく入ったかはまだ検証してない・・・。文字解析は苦手なので、汚いプログラムになってしまった。

しかし、ニコ動のHTMLは、一部正しくない&汚い。
例えば、検索結果ページで<tr>タグが閉じていないところがあったり<table>タグの中に<table>タグが入っていたり、動画ページで<script>タグ内でコメント(<!-- ~ -->)でスクリプトをくくっていないとか。
なんだかんだで、ニコ動用HTML DOMになってしまったような気がする。
・・・まあいいや。必要な情報が取得できれば。(確認していないからちゃんととれるか心配だ。近いうちに書き換えよう・・・)

そして謎の仕様を書いておく。
ファイルの先頭9バイト:ヘッダ部分
・'FLV'固定:3バイト(46 4C 56)
・1バイト(01)
・1バイト(05)
・4バイト(00 00 00 09)
特に見ておく必要はない。

以降は、データ部分。
previous tag size:4バイト(00 00 00 00)
tag type:1バイト(0x08:Audio、0x09:Video、0x12:META)
body length:3バイト
time stamp:3バイト
time stamp extended:1バイト
stream id:3バイト
データ:body length分のデータ

これの繰り返し。

Audioのデータは細切れのように短いデータ長のものが、何個も散在している。
明日、C#で抽出・結合するプログラムを書いてみようと思う。(謎)

« 読了:神無き世界の英雄伝 1 | トップページ | 行き当たりばたりなプログラム:FLVからMP3をブッコ抜く »

コメント

コメントを書く

(ウェブ上には掲載しません)

トラックバック


この記事へのトラックバック一覧です: 行き当たりばたりでプログラムを作っています:

» 検索結果.com [検索結果.com]
検索結果.について、参考になりました。情報ありがとうございました。 [続きを読む]

« 読了:神無き世界の英雄伝 1 | トップページ | 行き当たりばたりなプログラム:FLVからMP3をブッコ抜く »