#+TITLE: "参考資料/弁護士業界の現状/落合洋司弁護士(東京弁護士会)/落合洋司弁護士の書籍発売(平成31年1月4日)とホリエモンこと堀江貴文氏"
#+AUTHOR: 廣野秀樹
#+EMAIL: hirono2013k@gmail.com
#+DATE: 2019-01-05 09:40:46 +0900
FILE_NAME: 2019-01-05-094046_落合洋司弁護士の書籍発売(平成31年1月4日)とホリエモンこと堀江貴文氏.org
CATEGORY: 石川県警察御中,金沢地方検察庁御中
tags: 落合洋司弁護士(東京弁護士会) ホリエモン 堀江貴文氏 検察
記事タイトル名の文字数:66 保存ファイル名の文字数:58
#contents
* TwitterAPIで堀江貴文氏の最新3179件のツイートを取得し、落合洋司弁護士(東京弁護士会)に関するツイートを探してみた
:LOGBOOK:
CLOCK: [2019-01-05 土 09:48]--[2019-01-05 土 11:29] => 1:41
:END:
>>>2019-01-05(土曜日)09:49_[これからの記述範囲の開始時刻]>>>
```
Diginnos-PC:~/work
[9991] % TU=`xsel -b|sed 's/.*twitter\.com\/\([^ /]\+\).*/\1/'`; echo $TU; h-show-twitter-profile.rb $TU; for x in {1..16};do tw_user_timeline_1line.rb $TU 200 $x >> $TU; done && st=$(grep "^\(▶TW \|▶RT \).*" $TU |tail -1|sed "s/.*日時:\(....\)-\(..\)-\(..\) \(..\):\(..\)[ /].*/\1\2\3\4\5/"); et=$(grep "^\(▶TW \|▶RT \).*" $TU |head -1|sed "s/.*日時:\(....\)-\(..\)-\(..\) \(..\):\(..\)[ /].*/\1\2\3\4\5/"); mv $TU ${TU}_${st}-${et}.txt; echo -e "\n取得件数: "; grep "^\(▶TW \|▶RT \).*" ${TU}_${st}-${et}.txt| wc -l; echo "取得した最新ツイート:"; sed -n '1p' ${TU}_${st}-${et}.txt; echo "取得した最古ツイート:"; sed -n '$p' ${TU}_${st}-${et}.txt
takapon_jp
<2019年01月05日(土) 09時03分27秒にTwitterAPIで取得したtakapon_jp(堀江貴文(Takafumi Horie))のプロフィール情報>
有料メルマガ https://t.co/v7FWkrLGPzで登録
info@takapon-jp.com
For WAGYUMAFIA media requests or collaboration contact
Pr@wagyumafia.com
取得件数:
3179
取得した最新ツイート:
▶TW takapon_jp(堀江貴文(Takafumi Horie)) 日時:2019-01-05 00:00 URL: https://twitter.com/takapon_jp/status/1081203714898051073 TWEET: 私、堀江貴文に対するよくある質問、手がけている事業の詳細などは、こちらのリンクへ https://t.co/RtWZHjZV4k
取得した最古ツイート:
▶TW takapon_jp(堀江貴文(Takafumi Horie)) 日時:2018-12-12 18:05 URL: https://twitter.com/takapon_jp/status/1072779587623350273 TWEET: 本番よろしくー! \n https://t.co/BrgYxAeRzw https://t.co/35QVuXMx6H
Diginnos-PC:~/work
[9992] % grep yjochi takapon_jp_201812121805-201901050000.txt
▶RT takapon_jp(堀江貴文(Takafumi Horie))|yjochi(落合洋司🇯🇵 「ニチョウ 東京地検特捜部特別分室」発売中!) 日時:2019-01-04 13:34/2019-01-03 22:23 URL: https://twitter.com/takapon_jp/status/1081046308650020864 https://twitter.com/yjochi/status/1080816932368990208 TWEET: 堀江さん @takapon_jp に帯コメントしていただいた「ニチョウ 東京地検特捜部特別分室 (朝日文庫) 」、Kindleでも1月4日から配信です! \n https://t.co/qC9FVjvIIY @amazonJPより https://t.co/G4Efi0Mb0X
▶RT takapon_jp(堀江貴文(Takafumi Horie))|yjochi(落合洋司🇯🇵 「ニチョウ 東京地検特捜部特別分室」発売中!) 日時:2019-01-04 13:26/2019-01-04 09:32 URL: https://twitter.com/takapon_jp/status/1081044099652698112 https://twitter.com/yjochi/status/1080985298627059713 TWEET: 堀江さん @takapon_jp に帯コメントしていただいた「ニチョウ 東京地検特捜部特別分室」は、本日、1月4日発売です! https://t.co/7SSvcITDrb
▶RT takapon_jp(堀江貴文(Takafumi Horie))|yjochi(落合洋司🇯🇵 「ニチョウ 東京地検特捜部特別分室」発売中!) 日時:2019-01-04 12:43/2019-01-04 12:15 URL: https://twitter.com/takapon_jp/status/1081033385521209346 https://twitter.com/yjochi/status/1081026405494775808 TWEET: 堀江さん @takapon_jp に帯コメントしていただいた「ニチョウ 東京地検特捜部特別分室」は、本日発売です! https://t.co/A7nCpZRaSH
▶RT takapon_jp(堀江貴文(Takafumi Horie))|yjochi(落合洋司🇯🇵 「ニチョウ 東京地検特捜部特別分室」発売中!) 日時:2019-01-03 14:36/2019-01-03 12:27 URL: https://twitter.com/takapon_jp/status/1080699324231602176 https://twitter.com/yjochi/status/1080666827204681728 TWEET: 堀江さん @takapon_jp に帯コメントしていただいた「ニチョウ 東京地検特捜部特別分室」は、明日発売です! https://t.co/PhFyncuuRG
Diginnos-PC:~/work
[9993] % ls
takapon_jp_201812121805-201901050000.txt
Diginnos-PC:~/work
[9994] %
```
TwitterAPIで取得したツイートのデータは、自分で書式設定をしています。それでないと一度に取得するツイートのデータは大きすぎる情報量となり、複数のツイートだと取り扱いも困難です。
プログラムでのデータ処理というのは1件を改行で区切るのが最も取り扱いがしやすいです。扱いたいデータの内容にもよりますが、ある程度の情報を盛り込むと、文字数は200から300を超えることもあり、これだと文字数超過でツイートとして扱うことは出来ません。
実行した検索結果は全てリツイートでした。「yjochi」という落合洋司弁護士(東京弁護士会)のTwitterユーザー名をキーワードにしています。対象のデータにはツイートとリツイートのユーザ名、プロフィールの名前、日付、URLという情報を持たせています。
データの行頭には「▶RT 」という記号を振ることで、この場合はリツイートであることを示しています。
次の「takapon_jp(堀江貴文(Takafumi Horie))|yjochi(落合洋司🇯🇵 「ニチョウ 東京地検特捜部特別分室」発売中!)」が、リツイートしたユーザ情報、|、で区切りを入れ、リツイートされた元のツイートのユーザ情報としています。
続くのがリツイートした投稿時刻と、リツイートされた元のツイートの投稿時刻になります。「日時:2019-01-04 13:34/2019-01-03 22:23」という書式にしています。これは取得した中では最新の情報です。
さらに続くのがURLですが、これは半角スペースで区切り、リツイートしたURLとリツイートされた元のツイートのURLを並べています。
私自身、ネットの情報等で見たことはないのですが、TwitterAPIのデータを見ていると、リツイートの実体も、リツイートしたユーザのツイートと同じなのだということがよくわかります。ただ、リツイートのURLを開くと開かれるのはリツイートした元のツイートのURLになります。
私はスクリプトで「tweet.retweeted_status.user.name.to_s.empty?」を条件式としてツイートかリツイートを判別し、処理を振り分けています。
リツイートの場合はtweet.retweeted_statusというデータが情報を持つことになり、そうでない場合は空ということになります。
ツイートの本体もリツイートしたユーザのものと、そのツイートが保持するリツイートしたツイートのデータは、まったく別のものとなります。次がリツイートしたユーザのツイートととしてのデータになります。
=> "RT @yjochi: 堀江さん @takapon_jp に帯コメントしていただいた「ニチョウ 東京地検特捜部特別分室 (朝日文庫) 」、Kindleでも1月4日から配信です!\nhttps://t.co/qC9FVjvIIY @amazonJPより https://t.co/G…"
tweetというのはライブラリを使ったインスタンスとなりますが、そこに保持されているのは1件のツイートの全ての情報になります。オブジェクトとなっていてメソッドや変数を保持しているので、その仕様に従えばデータを取り出すことができます。
上記のデータの場合は、「tweet.text」の返した値になります。次のデータは同じく「tweet.retweeted_status.text」が返す値になります。変数の値の場合とアクセサメソッドの値の場合があるのかと思いますが、返却値は同じかと思います。
=> "堀江さん @takapon_jp に帯コメントしていただいた「ニチョウ 東京地検特捜部特別分室 (朝日文庫) 」、Kindleでも1月4日から配信です!\nhttps://t.co/qC9FVjvIIY @amazonJPより https://t.co/G4Efi0Mb0X"
ただ、返却値の値の見た目が文字列であっても、データの型が異なることがあります。これは「tweet.retweeted_status.text.class」とすることで確認できます。「=> String」という感じで値が返りました。ストリング型なので文字列です。
「tweet.retweeted_status.class」で型を確認すると「Twitter::Tweet」となっています。ライブラリが提供するクラスの型だと思います。他に配列やハッシュ(連想配列)という型も多いです。
型に応じて文字列の取り出し方も違ってきますし、エラーが起こることもあります。私もさんざん痛い目にあってきました。修行のような積み重ねだったと思います。独学でやってきました。学習の効率は悪かったと思います。
他に「落合」でも検索をしてみたのですが、ざっと見たところ「落合陽一」しか見当たらなかったように思います。スクリプトの処理結果は、複数のデータの処理結果だと、改行も少なくずいぶんと見づらいものとなり、見落としの可能性も高いと思います。
データを見やすく整形するのもスクリプトを作る自分しだいなのですが、個別のデータを見やすくすると情報量と表示範囲が広がり、その数が増えると範囲も大幅に広がるので、それはそれで見通しがききづらくなってしまいがちです。
このエントリーもブログの方へ投稿すれば見てもらえると思いますが、多くて3100台のツイートを取得しテキストファイルとして保存する処理は、なかに他のスクリプトを呼び出してはいるものの、1行の一つのコマンドとして実行しています。ワンライナーとも呼ばれるものです。
「takapon_jp_201812121805-201901050000.txt」というのが実行結果として生成されたテキストファイルです。3179行となっていますが、空行は含みません。1行は1つのツイートに対応しているので、そのまま3179件のツイートというデータになります。
テキストファイルとして保存することで、実にさまざまな操作や処理が可能になります。例えばtacというコマンドがあるのですが、テキストファイルの内容を全て逆順に表示するものとなります。1件のデータが複数行を含んでいると、不整合を生じます。
「takapon_jp_201812121805-201901050000.txt」がファイル名ですが、取得できた範囲で最古と最新のツイートの日時を取り出して使っています。文字列から文字列の取り出しや、文字列の追加というのもよくやるテキスト処理です。
```
[9997] % cat takapon_jp_201812121805-201901050000.txt |grep '日時:2018-12-22'|wc -l
97
```
上記のような使い方も出来ます。形式上は2018年12月22日の堀江貴文氏のツイートをリツイートを含めカウントしたことになり、97件とわかりましたが、 '日時:2018-12-22'という文字列がたまたまツイートに含まれていてもカウントされます。
上記の検索では正規表現を使っていませんが、厳密な正規表現の書式で絞り込めば、偶然に紛れ込むような情報は排除できると思います。
思いつきもあるのですが、「検察」で検索を行ったところ、数は少なかったですが、興味深い情報が見つかりました。
それと、昨日だったように思いますが、いや一昨日かもしれません。通常のブラウザで開いた堀江貴文氏のTwitterのタイムラインで、ページをスクロールダウンさせながら落合洋司弁護士(東京弁護士会)に関するツイートを探していたとき見つからなかったのは、
告発\市場急配センター殺人未遂事件\金沢地方検察庁・石川県警察御中(@kk_hirono)のアカウントでログインした状態で堀江貴文氏のTwitterタイムラインを閲覧していたためで、ブロックされているアカウントのツイートは、リツイートとしても表示されないようです。
これは前からわかっていたことでした。落合洋司弁護士(東京弁護士会)の場合、いったいどれほどの数のブロックをしているものか気になるところでもあります。ブロックという行為に対する落合洋司弁護士(東京弁護士会)のツイートの発言内容自体が尋常のものではなかったです。
落合洋司弁護士(東京弁護士会)について気になるのは、その書籍の紹介をするツイートのリツイートやいいねの少なさもあります。300万人を超えるフォロワーを持つ堀江貴文氏のアカウントにリツイートされるだけでも、人の目に触れる機会は多かったのではと想像されます。
落合洋司弁護士(東京弁護士会)のブロックについては、これまでに何度か検索結果のまとめ記事を作成、投稿していると思いますが、これも最新情報を取り込むため新規に作成し、いろいろと次に取り上げてご紹介をしておきたいと思います。
<<<2019-01-05(土曜日)11:29_[これまでの記述範囲の終了時刻]<<<
0 件のコメント:
コメントを投稿