2つのコマンドは、データを抽出するデータベースのテーブルが異なるだけです。スクリプトでは主なオプションを3つ作っています。今のところ-l、-p、-mの3つです。それぞれ実行結果を一つだけ取得してご紹介します。
[3094] % dp -l |tail -1
2018年05月06日18時31分の登録: #弁護士大西洋一 @o2441#のツイート/2018-04-26_2017〜2018-05-06_1456/法務検察・石川県警察宛参考資料/記録作成措置実行日時:2018年05月06日18時31分 http://hirono2014sk.blogspot.com/2018/05/o24412018-04-2620172018-05.html
[3095] % dp -p |tail -1
2018年05月06日18時31分の登録: #弁護士大西洋一 @o2441#のツイート/2018-04-26_2017〜2018-05-06_1456/法務検察・石川県警察宛参考資料/記録作成措置実行日時:2018年05月06日18時31分 http://hirono2014sk.blogspot.com/2018/05/o24412018-04-2620172018-05.html>
−lオプションは、普通に最終更新登録時刻、記事のタイトル名、記事のURLを表示したもので、−pオプションは、Emacsで扱うMarkdown用に少し書式に変更を加えたものです。残る−mオプションは、正規表現を使ったデータの抽出を前提に、CSSでHTMLを修飾します。
[3098] % dp -m | egrep '@motoken_tw.+2018-05.*'
2018年05月06日01時59分の登録: #モトケン @motoken_tw#のツイート/2018-05-02_1001〜2018-05-06_0037/法務検察・石川県警察宛参考資料/記録作成措置実行日時:2018年05月06日01時59分 <http://hirono2014sk.blogspot.com/2018/05/motokentw2018-05-0210012018-05.html>
2018年05月06日12時30分の登録: #モトケン @motoken_tw#のツイート/2018-05-03_0747〜2018-05-06_1218/法務検察・石川県警察宛参考資料/記録作成措置実行日時:2018年05月06日12時30分 <http://hirono2014sk.blogspot.com/2018/05/motokentw2018-05-0307472018-05.html>
2018年05月06日17時09分の登録: #モトケン @motoken_tw#のツイート/2018-05-03_0813〜2018-05-06_1653/法務検察・石川県警察宛参考資料/記録作成措置実行日時:2018年05月06日17時09分 <http://hirono2014sk.blogspot.com/2018/05/motokentw2018-05-0308132018-05.html>
HTMLに加えCSSを使うと記号としての文字列が多く含まれてしまうのでTwitterには投稿できませんが、処理結果の記事は3件でした。この出力はAPIの投稿ではなく、通常のブラウザでの投稿画面でコピペで貼り付けることを想定しています。
臨機応変の幅も広がるので、他のスクリプトのように自動で定型書式のタイトル名をつけることも想定してません。もう少しひねって考えた方がいいとも思うのですが、今のところ知恵も及ばないでいます。
試しに一つ記事を作ってみます。次に予定している小項目の参考資料です。
奉納\危険生物・弁護士脳汚染除去装置\金沢地方検察庁御中: 「くまえもん(@kumaemon9)さん」という弁護士と思われる匿名アカウントに関する登録済み記事の一覧 http://hirono2014sk.blogspot.jp/2018/05/kumaemon9.html>
工夫が足りないとは思いましたが、正規表現で抽出できるデータは千差万別なので、やはりその都度対応するしかないと思います。
dpのコマンドは、「奉納\危険生物・弁護士脳汚染除去装置\金沢地方検察庁御中」のブログに、kpのコマンドは、「市場急配センター殺人未遂事件に加担した4弁護士2裁判官の告訴告発」のブログにそれぞれ対応させています。
Diginnos-PC:~
[3114] % date
2018年 5月 6日 日曜日 21:45:26 JST
Diginnos-PC:~
[3115] % date
2018年 5月 6日 日曜日 21:45:36 JST
Diginnos-PC:~
[3115] % dp -l |wc -l
15346
Diginnos-PC:~
[3116] % kp -l |wc -l
87
Diginnos-PC:~
[3117] % date
2018年 5月 6日 日曜日 21:45:44 JST
現時点で、dpに対応したブログは、15346という登録数。kpに対応したブログは、87件と圧倒的に少ないです。準備は整ったので、これからはkpを増やしていく方針です。どちらも簡潔で適当なコマンド名ですが、kpは、告訴告発を意識した名前付けとなっています。
なお、最後に、エントリーと小項目の使い分けですが、ファイルのデータ量よりは、引用したツイートの数を目安にしたいと考えています。これまでに何度かご説明してきたことですが、ブログの記事のページ内で200件を超えると、埋め込みツイートのデザインが適用されない場合があります。
もっとも小項目の投稿記事では表示のツイートが200件を超えることは余りないとも考えるので、エントリーの記事の方は見やすい埋め込みツイートのデザインの適用がなくても、さほど問題はないとも考えます。
投稿済みの次の小項目の記事ですが、ソースコードに含まれる半角の山カッコがHTMLのタグとして認識されたため、ページのレイアウトが崩れ、サイドバーの部分の表示がなくなっていました。このあたりも悩ましいところです。
市場急配センター殺人未遂事件に加担した4弁護士2裁判官の告訴告発: # 「市場急配センター殺人未遂事件に加担した4弁護士2裁判官の告訴告発」のブログへの投稿、編集中の書面、エントリーと小項目の区別について # http://hirono2017kk.blogspot.jp/2018/05/4.html>
半角で<>というHTMLタグに使われる記号は、同じく半角文字で&lt;、&gt;と記述するか、置換処理する必要があります。
文字を置換して前の記事を削除し、あらたに投稿し直しました。テキストファイルの見た目は悪くなっていますが、ブラウザのブログの記事は、きれいに表示されていました。
市場急配センター殺人未遂事件に加担した4弁護士2裁判官の告訴告発: # 「市場急配センター殺人未遂事件に加担した4弁護士2裁判官の告訴告発」のブログへの投稿、編集中の書面、エントリーと小項目の区別について # http://hirono2017kk.blogspot.jp/2018/05/4_73.html>
Markdownでは、HTMLのソースはそのままHTMLとしてブラウザに表示されることになっているようですが、GitHub PagesでもHTMLのタグが含まれているとエラーの表示が出ていました。
やはりHTMLは使わず、Bloggerへの投稿時にのみHTMLを含む置換処理をした方がいいのかもしれません。普段、頭の中で考えていることですが、今回は書き起こしてご説明をしました。余り時間を掛けたくはないのですが、できるだけ改善をし、質を高めて行きたいところです。
最近は触ることもないのですが、Bloggerは自由度が高く、HTMLのヘッダ部分まで編集することができるはずです。自由度が高い反面、bodyタグの本体部分でもHTMLのタグにバグがあると、サイドバーが表示されないか、ページの真下の部分に表示されることがあります。
4件目 ツイート: kumaemon9(くまえもん) 日時: 2018-05-06 16:17 URL: <https://twitter.com/kumaemon9/status/993026977111027712>
{% tweet 993026977111027712 %}
わざわざ相手方に戦術をレクチャーしてあげる弁護士の存在意義について
0 件のコメント:
コメントを投稿