blog.hekt.org

部分配信のアメーバブログRSSから全文を取得する

「著作権保護のために~」よくわからない理由で全文配信されないアメブロのRSSから全文を取得するパイプこの前も使ったYahoo Pipesです。テキストボックスに全文出力させたいブログのRSSのURIを入力してRun pipesボタンを押せば、RSSリーダーへの登録リンクやRSSへのリンクが表示されます。たぶん。

“<div class=”subContents”>”から”</div><!–//.subContents–>”までの内容を取得してRSSとして出力しているので、これらの記述がないブログではエラーが発生します。アメブロの仕様はしりませんが、少なくとも僕が使ってみた限り(ダルビッシュ・江尻・藤井のオフィシャルブログ)では、アメンバー限定ブログとかで内容を取得できない場合以外は問題ありませんでした。ついでにタイトルに”PR:”を含むエントリーも除去しています。

ほとんどのブログで記事本文がクラスつきのdivタグでくくられているので、抽出の条件を変えればいくらでも応用出来そうですね。今度やってみよう。