RSSの取得,生成を行なうプラグインです。基本的にはすべてのpipelineはsubscription内のモジュールから開始されます。
RSSファイルを取得します。
サブモジュールを指定できます。サブモジュールを指定すると、RSSファイルだけでなく、ほかのモジュールを使用してRSSに変換できます。例えば、サブモジュールにmixidiaryを指定することで、このモジュールの中でmixidiaryも同時に扱えます。
例:
- module: subscription.config config: feed: - http://www.liris.org/blog/RSS - http://dev.ariel-networks.com/Members/blog_update/RSS sub-modules: - module: subscription.mixidiary config: userid: mixiuserid password: mixipassword
HTMLファイルを取得してパースし,RSSに変換するプラグインです。
HyperEstraierで全文検索して、RSSに変換するプラグインです。
メールサーバ(POP3)からメールを取得して,RSSにします。
* author: RSSの各エントリにつけられる作成者の名前です。省略すると「habu」になります。
mixiの「マイミクシィ最新日記 」からデータを抜き出してRSSとして処理するためのプラグインです。
テスト用です。気にしないでください。
filterでは主に取得したRSSの加工を行ないます。
時刻フォーマットの修正,正規化をします。日付がない初めて取得したエントリに現在時間を挿入します。以前取得したことのある日付のないエントリには,以前取得したときの時刻が挿入されます。取得日時の情報はオンメモリー,または,SQLObjectのデータベースに保存します。
* time_offset: タイムゾーンが設定されていない場合の日時表記で、時間のオフセットを数値で指定します。デフォルトでは0で、日本では9のはず。
エントリの中を検索して,一致するものだけ、または、一致しないものだけを削除します。
COREBlog2のmoblogのフォーマットに一致しないものを削除します。フォーマットはsummaryが次のようになっています。プラグインを通すと,blogに掲載する本文だけになります。
更新用パスワード 本文
各エントリのタイトルをカスタマイズします。
formatでフォーマットを指定します。entriesの各エントリのキーを指定できます。フィードのタイトル、リンクはそれぞれ、feed.title、feed.linkで指定できます。「エントリのタイトル - フィードのタイトル」にフォーマットしたい場合は、次のように記述します。
- module: format_title config: format: "%(title)s - %(feed.title)s"
エントリの順番を並び替えます。
重複したエントリを削除します。
エントリを範囲指定して抜き出します。
Pythonの構文の entries[start:end] に対応します。
最初のエントリだけを抜き出します。
habuでは一つのパイプライン(フィルタチェーン)を並列に処理できます。並列に処理されているものを,一つのスレッドに戻すためのプラグインです。
エントリの並び順を反転します。
文字列置換します。
配列で次のデータを指定します。
RSSファイルを開いて,チェーンに流れてきたデータに追加します。
初めて取得したエントリだけにフィルタリングするためのプラグインです。取得したかどうかのデータはメモリ上に保存することもできますが,設定でpathを指定してdbmに保存することをお勧めします。
テスト用です。気にしないでください。
主にファイルやデータベース、全文検索エンジンへの登録などの外部への出力を目的としたプラグインです。出力を複数組み合わせることもできます。
RSSファイルを指定したディレクトリに作成します。既にファイルが存在する場合は上書きされます。既存のRSSファイルに追加したい場合は,filter.rssloadを行なってから書き込むようにしてください。
各エントリをHyperEstraierの全文検索インデックスに登録するためのプラグインです。エントリのタイトルとサマリー、エントリへのURLをHyperEstraierに登録します。
habuのデータベースにデータを保存できます。
自家製blogシステムのエントリ更新用です。気にしないでください。
そのうちCOREBlog2用エントリ更新ツールも作ります。
テスト用です。気にしないでください。
テスト用です。気にしないでください。