アフィリエイト広告を利用しています

広告

posted by fanblog
プロフィール

Elwood
<< 2022年12月 >>
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
最新コメント



月別アーカイブ

広告

posted by fanblog
2009年03月04日
書き込み時間解析(1)
 例の匿名掲示板の某スレをかなり意識した覚書です。そこの住人の方、そこをご存知の方は楽しめるかもしれませんが、そうでない人は単に秀丸やエクセルを使ってこんな事ができるんだぁ・・・くらいに見てもらえれば幸いです。(興味の無い方は読む価値は無い程度の文章と思われます)

 さて、今回のテーマは「スレッドへの書き込みがどの時間帯に集中しているか?」を調べるもの。用意するものは我が仕事の友、「秀丸」と「エクセル」です。

 まずはターゲットとなるスレッドをインターネットエクスプローラで行うとすると「表示」→「ソース」でテキスト表示し、秀丸に貼り付けます。(もしくは直接秀丸で開いてもOK)するとHTMLタグが混在した形でスレッドが見られますが、今回は書き込みが行われた時間とIDをこのテキストから抜き出す作業をしてみます。

 ここから先、秀丸がある程度分かる人向けに書きますが、最初に書き込み時間の行とIDが表示されている行が分かれているのでこれをくっ付けておきます。やり方は時間が表示されている箇所を「正規表現」「あいまい検索」で次のような表現で引っ掛けます。

-------------------------
[0-9][0-9]:[0-9][0-9]:[0-9][0-9]\n
-------------------------

 これを検索後、「Endキー」「Del」で改行されていたIDが書き込みのあった日時を表す行と同じ行になります。後はこれを延々と繰り返し・・・はもちろんマクロを使ってください。疲れるだけですから(笑)。

 続いて以下の条件(もちろん「正規表現」「あいまい検索」)で「grepの実行」を行います。

-------------------------
[0-9][0-9]:[0-9][0-9]:[0-9][0-9]ID
-------------------------

 すると

【スレッドの名前】.htm(53): <DT>5 :<A href="mailto:sage"><B>Elwood</B></A>:2008/09/12(金) 00:54:19 ID:GZB9sz/D

 と言う様な行が「書き込み数分」出来上がります。まぁ、多少はゴミ(引用レスなど)がありますんで、これらを取り除いた後、「置換」を使って要所要所にタブを入れたりして整形した後にエクセルへ貼り付けることにより、羅列した文字がデータとして息を吹き込まれます。

 で、その後はちょっと面倒なので割愛しますが、今回、(2ちゃん用語でスミマセン)「AGE」「SAGE」の2つに分けて統計を取ってみると、今回ターゲットにしたスレッドではちょっとした特徴が現れました。(つづく)

{a8.net http://item.rakuten.co.jp/book/1765685}{a8.net http://item.rakuten.co.jp/book/1672256}{a8.net http://item.rakuten.co.jp/book/1636877}

この記事のURL
トラックバック
この記事へのトラックバックURL
※ブログオーナーが承認したトラックバックのみ表示されます。
https://fanblogs.jp/tb/52995
コメント
お名前:

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
※ブログオーナーが承認したコメントのみ表示されます。

コメント

 
タグクラウド
最新記事
カテゴリアーカイブ
リンク集
https://fanblogs.jp/elwood/index1_0.rdf
QRコード

×

この広告は30日以上新しい記事の更新がないブログに表示されております。