=begin # mixi_get_diary_text mixiの日記のURLから日記本文を取得する。 ## ダウンロード http://bmky.net/product/pragger/#mixi_get_diary_text ## 解説 日記のURLから日記本文を取得する。 ## 使い方 既存のmixi_get_diary_list.yamlの以下の部分に追加します - module: myplugin::RSS::html2feed ~~~~~中略~~~~~ limit: 5 # 日記本文を取得 - module: myplugin::mixi_get_diary_text config: authfile: config/mixi_auth.yaml # 日付を正しいフォーマットに変換 - module: myplugin::RSS::elem_subs ## 更新履歴 2008/11/17 : リリース =end require 'rubygems' require 'mechanize' require 'logger' def mixi_get_diary_text( config, data ) auth = YAML.load( File.read( config['authfile'] ) ) agent = WWW::Mechanize.new page = agent.get( 'http://mixi.jp/' ) form = page.forms[0] form.fields.find { |f| f.name == 'email' }.value = auth["email"] form.fields.find { |f| f.name == 'password' }.value = auth["password"] form.fields.find { |f| f.name == 'next_url' }.value = '/home.pl' page = agent.submit( form, form.buttons.first ) data.each do |item| p item.link body = agent.get_file( "http://mixi.jp/" + item.link ).toutf8 if body =~ /