2009年03月04日
書き込み時間解析(1)
例の匿名掲示板の某スレをかなり意識した覚書です。そこの住人の方、そこをご存知の方は楽しめるかもしれませんが、そうでない人は単に秀丸やエクセルを使ってこんな事ができるんだぁ・・・くらいに見てもらえれば幸いです。(興味の無い方は読む価値は無い程度の文章と思われます)
さて、今回のテーマは「スレッドへの書き込みがどの時間帯に集中しているか?」を調べるもの。用意するものは我が仕事の友、「秀丸」と「エクセル」です。
まずはターゲットとなるスレッドをインターネットエクスプローラで行うとすると「表示」→「ソース」でテキスト表示し、秀丸に貼り付けます。(もしくは直接秀丸で開いてもOK)するとHTMLタグが混在した形でスレッドが見られますが、今回は書き込みが行われた時間とIDをこのテキストから抜き出す作業をしてみます。
ここから先、秀丸がある程度分かる人向けに書きますが、最初に書き込み時間の行とIDが表示されている行が分かれているのでこれをくっ付けておきます。やり方は時間が表示されている箇所を「正規表現」「あいまい検索」で次のような表現で引っ掛けます。
-------------------------
[0-9][0-9]:[0-9][0-9]:[0-9][0-9]\n
-------------------------
これを検索後、「Endキー」「Del」で改行されていたIDが書き込みのあった日時を表す行と同じ行になります。後はこれを延々と繰り返し・・・はもちろんマクロを使ってください。疲れるだけですから(笑)。
続いて以下の条件(もちろん「正規表現」「あいまい検索」)で「grepの実行」を行います。
-------------------------
[0-9][0-9]:[0-9][0-9]:[0-9][0-9]ID
-------------------------
すると
【スレッドの名前】.htm(53): <DT>5 :<A href="mailto:sage"><B>Elwood</B></A>:2008/09/12(金) 00:54:19 ID:GZB9sz/D
と言う様な行が「書き込み数分」出来上がります。まぁ、多少はゴミ(引用レスなど)がありますんで、これらを取り除いた後、「置換」を使って要所要所にタブを入れたりして整形した後にエクセルへ貼り付けることにより、羅列した文字がデータとして息を吹き込まれます。
で、その後はちょっと面倒なので割愛しますが、今回、(2ちゃん用語でスミマセン)「AGE」「SAGE」の2つに分けて統計を取ってみると、今回ターゲットにしたスレッドではちょっとした特徴が現れました。(つづく)
{a8.net http://item.rakuten.co.jp/book/1765685}{a8.net http://item.rakuten.co.jp/book/1672256}{a8.net http://item.rakuten.co.jp/book/1636877}
さて、今回のテーマは「スレッドへの書き込みがどの時間帯に集中しているか?」を調べるもの。用意するものは我が仕事の友、「秀丸」と「エクセル」です。
まずはターゲットとなるスレッドをインターネットエクスプローラで行うとすると「表示」→「ソース」でテキスト表示し、秀丸に貼り付けます。(もしくは直接秀丸で開いてもOK)するとHTMLタグが混在した形でスレッドが見られますが、今回は書き込みが行われた時間とIDをこのテキストから抜き出す作業をしてみます。
ここから先、秀丸がある程度分かる人向けに書きますが、最初に書き込み時間の行とIDが表示されている行が分かれているのでこれをくっ付けておきます。やり方は時間が表示されている箇所を「正規表現」「あいまい検索」で次のような表現で引っ掛けます。
-------------------------
[0-9][0-9]:[0-9][0-9]:[0-9][0-9]\n
-------------------------
これを検索後、「Endキー」「Del」で改行されていたIDが書き込みのあった日時を表す行と同じ行になります。後はこれを延々と繰り返し・・・はもちろんマクロを使ってください。疲れるだけですから(笑)。
続いて以下の条件(もちろん「正規表現」「あいまい検索」)で「grepの実行」を行います。
-------------------------
[0-9][0-9]:[0-9][0-9]:[0-9][0-9]ID
-------------------------
すると
【スレッドの名前】.htm(53): <DT>5 :<A href="mailto:sage"><B>Elwood</B></A>:2008/09/12(金) 00:54:19 ID:GZB9sz/D
と言う様な行が「書き込み数分」出来上がります。まぁ、多少はゴミ(引用レスなど)がありますんで、これらを取り除いた後、「置換」を使って要所要所にタブを入れたりして整形した後にエクセルへ貼り付けることにより、羅列した文字がデータとして息を吹き込まれます。
で、その後はちょっと面倒なので割愛しますが、今回、(2ちゃん用語でスミマセン)「AGE」「SAGE」の2つに分けて統計を取ってみると、今回ターゲットにしたスレッドではちょっとした特徴が現れました。(つづく)
{a8.net http://item.rakuten.co.jp/book/1765685}{a8.net http://item.rakuten.co.jp/book/1672256}{a8.net http://item.rakuten.co.jp/book/1636877}
【このカテゴリーの最新記事】
-
no image
-
no image
-
no image
-
no image
-
no image
-
no image
-
no image
-
no image
-
no image
-
no image