ページ

title

告発\金沢地方検察庁\最高検察庁\法務省\石川県警察御中
弁護士と裁判官が共同で確定させた傷害・準強姦被告事件判決の再捜査要請に係る石川県警察珠洲警察署提出書面の情報公開

殺人未遂事件幇助の被告訴人: 木梨松嗣弁護士(金沢弁護士会)、岡田進弁護士(金沢弁護士会)、長谷川紘之弁護士(金沢弁護士会)、若杉幸平弁護士(金沢弁護士会)
名誉毀損罪の被告訴人: モトケンこと矢部善朗弁護士(京都弁護士会)、小倉秀夫弁護士(東京弁護士会)
市場急配センター株式会社 石川県金沢市駅西本町5丁目10番20所在
作成管理者: 石川県鳳珠郡能登町字宇出津 廣野秀樹
金沢地方検察庁御中

2021年4月8日木曜日

補充書01### 2021年4月7日の朝から翌8日未明まで20時間ほど掛かって作成した,ツイートをテキスト保存するスクリプト

補充書01### 2021年4月7日の朝から翌8日未明まで20時間ほど掛かって作成した,ツイートをテキスト保存するスクリプト

:CATEGORIES: @kanazawabengosi #金沢弁護士会 @JFBAsns 日本弁護士連合会(日弁連) #法務省 @MOJ_HOUMU #スクリプト #プログラミング

 寝ていた時間も含めてですが20時間ほど掛かったように思います。次のツイートがようやく完成した頃の投稿になります。タイムラインには4時間前と表示されています。

- TW kk_hirono(刑事告発・非常上告_金沢地方検察庁御中) 日時: 2021/04/08 05:42:43 URL: https://twitter.com/kk_hirono/status/1379897448391340033
(py37_env) ➜ twilog wc -l *.csv
227225 hirono_hideki20210408054207.csv
137286 kk_hirono20210408054209.csv
79830 s_hirono20210407224547.csv
444341 合計

 今回はこのあとソースコードを公開しようと思います。告発状でもご紹介したTwilogのテキストデータですが,TwitterAPIからツイートを取得して追加をするようにしました。3件のアカウントで10分程掛かっていた処理が1秒足らずで終わるようになりました。

```
(py37_env) ➜ twilog wc -l *.csv
227259 hirono_hideki20210408102712.csv
137294 kk_hirono20210408104001.csv
79835 s_hirono20210408102047.csv
444388 合計
```

 20210408104001という部分が最終更新時刻になりますが,やはり読みづらく勘違いする可能性もありそうなので,これは早めに修正をしておいた方がよいかと考えました。

```
now_time = Time.now.strftime("%Y-%m-%d_%H%M%S")
newFile = "#{@dir}#{user}#{now_time}.csv"
check = Dir.glob("#{@dir}#{user}[0-9]{4}-[0-9]{2}-[0-9]{2}_[0-9]{6}.csv").join
```

```
check = Dir.glob("#{@dir}#{user}[0-9]{4}-[0-9]{2}-[0-9]{2}_[0-9]{6}.csv").join
```

 上記の箇所に問題があることに気が付きました。Dir.globでは正規表現が使えないということです。

 次の方法でうまくいきそうです。もっと簡単に済ませる方法はあるのですが,プログラミングの上達のためによりよい方法を模索しています。

```
Dir.glob("#{@dir}*").grep(/s_hirono[0-9]{4}-[0-9]{2}-[0-9]{2}_[0-9]{6}.csv/)
```

 ようやくうまくいきました。.joinは必要なさそうでしたが,これは返却値が配列になっているのを文字列に型変換する処理です。文字列として扱うことを明示しておいた方がよいのかと考えていましたが,配列のままでもcheck.empty?の条件式は同じでした。

```
(py37_env) ➜ twilog wc -l *.csv
227262 hirono_hideki2021-04-08_114623.csv
137300 kk_hirono2021-04-08_114405.csv
79836 s_hirono2021-04-08_114625.csv
444398 合計
```

 それではソースコードの掲載です。今朝になっての思いつきですが,江村正之検察官について先に取り上げておこうかと思います。

```

```

 :count => "300"とハッシュ値の値を指定していますが,200件しか取得できないと思います。ただ,2,3日前同じ処理をするコマンドで300件の取得が出来たことがあり,TwitterAPIの仕様が変わったのかと思いました。多めに指定してもエラーはでないようです。

 時刻は12時03分ですが,昨日4月7日のほぼ同じ時間に,このスクリプトの本体は出来上がっていました。そのあと難儀し時間がかかったのは,ディレクトリーを指定し,新規にファイルを作成する場合の処理です。

 共通したコードを数箇所に貼り付けていけば,簡単に処理の分岐ができたのですが,無駄にコードが増えると全体の可読性が悪くなるので,その辺りも勉強のつもりで取り組んでみました。

0 件のコメント:

コメントを投稿