***>>2017-11-14(火曜日)05:18_[これからの記述範囲の開始時刻]>>***
投稿作業を終えたところですが、その前にスクリプトを編集し、端末にユーザ情報を出力させるようにしました。ツイートにおさまる文字数かと思っています。
Diginnos-PC:~/git/tweet-log_2015
[3213] % ajx-all-user-mysql-REGEXP_blogger_hirono2014sk.rb '倉持(麟太郎)?弁護士'
SELECT * FROM tw_user_tweet WHERE tweet REGEXP "倉持(麟太郎)?弁護士" ORDER BY tw_date ASC
ユーザ名称:都 行志 [screen_name]ユーザ名:Miyako_Koji フォロー数:615 フォロワー数:2750 ツイート数:22754
ユーザ名称:田村勇人 [screen_name]ユーザ名:tamura_hayato フォロー数:53 フォロワー数:40 ツイート数:886
ユーザ名称:弁護士 浜ちゃん [screen_name]ユーザ名:lawer_hamachan フォロー数:204 フォロワー数:1868 ツイート数:105923
ユーザ名称:ツンデレブログ [screen_name]ユーザ名:tsundereblog フォロー数:85 フォロワー数:504 ツイート数:7251
ユーザ名称:ゆるふわ暇弁 [screen_name]ユーザ名:himaben1st フォロー数:553 フォロワー数:1400 ツイート数:33560
ユーザ名称:Kay [screen_name]ユーザ名:nkaoguo フォロー数:537 フォロワー数:1101 ツイート数:5697
ユーザ名称:ピピピーッ [screen_name]ユーザ名:O59K2dPQH59QEJx フォロー数:76 フォロワー数:906 ツイート数:1508
ユーザ名称:ちゃんおに [screen_name]ユーザ名:KshAb76 フォロー数:53 フォロワー数:394 ツイート数:1734
ユーザ名称:中村剛(take-five) [screen_name]ユーザ名:take___five フォロー数:277 フォロワー数:3726 ツイート数:9533
ユーザ名称:KBブラック [screen_name]ユーザ名:bengoshi_black フォロー数:1178 フォロワー数:1203 ツイート数:51058
ユーザ名称:北白川 [screen_name]ユーザ名:GUv4i6 フォロー数:324 フォロワー数:417 ツイート数:4083
ユーザ名称:奉納\さらば弁護士鉄道・泥棒神社の物語 [screen_name]ユーザ名:hirono_hideki フォロー数:4749 フォロワー数:4835 ツイート数:115083
ユーザ名称:岡口基一 [screen_name]ユーザ名:okaguchik フォロー数:5 フォロワー数:37869 ツイート数:22123
ユーザ名称:弁護士あだちけいた㌠ [screen_name]ユーザ名:keita_adachi フォロー数:1896 フォロワー数:3024 ツイート数:116037
ユーザ名称:星 正秀(普通の弁護士) [screen_name]ユーザ名:hoshimasahide フォロー数:1432 フォロワー数:2406 ツイート数:62415
ユーザ名称:弁護士 Ms. X [screen_name]ユーザ名:msX_lawyer フォロー数:270 フォロワー数:147 ツイート数:2751
ユーザ名称:ほうたろう(法クラソシャゲ勢) [screen_name]ユーザ名:lawyerhotaro フォロー数:409 フォロワー数:1671 ツイート数:7870
ユーザ名称:坂本正幸 [screen_name]ユーザ名:sakamotomasayuk フォロー数:4454 フォロワー数:5542 ツイート数:164540
ユーザ名称:小倉秀夫 [screen_name]ユーザ名:Hideo_Ogura フォロー数:75 フォロワー数:14868 ツイート数:153724
ユーザ名称:たろう teacher [screen_name]ユーザ名:tomo_law_ フォロー数:493 フォロワー数:1404 ツイート数:24676
ユーザ名称:弁護士大西洋一 [screen_name]ユーザ名:o2441 フォロー数:11261 フォロワー数:19056 ツイート数:73635
ユーザ名称:えきなんローヤー [screen_name]ユーザ名:ekinan_lawyer フォロー数:89 フォロワー数:1081 ツイート数:25076
「ajx-all-user-mysql-REGEXP_blogger_hirono2014sk.rb」という自作のコマンドと言うかスクリプトですが、第一引数で検索ワードを指定しています。省略可能な第二引数では取得する日付の範囲を指定し、絞り込みが出来るようにしています。
上記のコマンドを実行することで、次のブログ記事が投稿されました。所要時間はデータ量や通信の状態によっても違うだろうと思いますが、数秒から長くても10秒は掛からないと思います。エラーが出て処理に失敗することも稀にはありますが、パソコンの状態に左右される感じです。
奉納\危険生物・弁護士脳汚染除去装置\金沢地方検察庁御中: REGEXP:”倉持(麟太郎)?弁護士”/データベース登録済みツイートの検索(2017年11月14日05時17分の記録26件) http://hirono2014sk.blogspot.jp/2017/11/regexp20171114051726.html
「奉納\危険生物・弁護士脳汚染除去装置\金沢地方検察庁御中」という部分はブログ名です。記事のタイトルを取得する時、このようにブログ名が付くのはBloggerの仕様です。文字数が多くなるとツイート出来ないので、この部分は削ってツイートすることもあります。
REGEXPというのは、MySQLのデータベース操作言語の命令語のようなもので、正規表現での検索を行うものです。他のプログラム言語の正規表現とは少し違いもあるようです。
具体的に最近気づいたもので、「組み?体操」の検索で失敗がありました。正規表現で?は直前の文字があってもなくてもよい、というものですが、そのまま実行すると取りこぼしがあったことに気が付きました。
「組(み)?体操」とすればよかったのですが、だいぶん前にも似たようなことがあって、そのあとすっかりわすれていたので、他に取りこぼしの出ているまとめ記事もあるかもしれません。気がつくきっかけとなったのは、絶対にあるはずだった次の深澤諭史弁護士のツイートです。
* ツイート:fukazawas(深澤諭史):2017/10/30 08:13: https://twitter.com/fukazawas/status/924776218058039296 :
件の黒髪事件にしろ、組体操にしろ、いろいろみていると、
>日本の小中高校って、日本国全体で、ミルグラム反応やスタンフォード監獄実験をやっているようにしか見えない。
>(・∀・;)もはや批判の対象とするだけではなくて、過去は貴重な研究サンプルとすべきとも思えてしまう。
まとめ記事ですが、全てスクリプトで自動生成した内容で、そのまま投稿をしています。10日から半月ほど前になりますか修正を加えて、表形式でユーザ毎のツイート数とリツイート数を表示させるようにしました。傾向分析の資料として状況を把握しやすくしたものです。
記事には、「SELECT * FROM tw_user_tweet WHERE tweet REGEXP "倉持(麟太郎)?弁護士" ORDER BY tw_date ASC」というMySQLの実行コマンドも表示させています。
これはデータの内容の確認のためでもありますが、ツイートの投稿日時を日付の小さい順、つまり古いものから並べていることになります。ソートの基準のtw_dateは自分で付けたフィールド名ですが、データベースへの登録日時は、create_timeなどとしています。
注意すべきは、リツイートとツイートの違いですが、リツイートのURLというのは、普通に取得しづらいもので、それを開いてもブラウザに表示されるのは元のツイートとそのURLです。これは普通にTwitterを利用しているだけでは、おそらく気づかないことで、情報を見ることもありません。
私としてはリツイートの内容より、リツイートをした弁護士関連のユーザ情報を重視し、それを基準にしています。普通にTwitterのタイムラインを見ていても、数年前のツイートがつい最近のリツイートのように表示されていて、しばらくそれに気が付かなった、という経験があります。
その誤解のツイートを探していたのですが、思いの外、探し出すのに手間取りました。内容をよく憶えていおらず、検索のキーワードを特定しづらかったからです。他にも思うところの多いツイートだったので、別の項目として扱いたいと思います。
***<<2017-11-14(火曜日)06:27_[これまでの記述範囲の終了時刻]<<***
0 件のコメント:
コメントを投稿