Tag Archives: クローラー

RubyでFireFoxを操作

RubyでFFを操作。

firewatirってのを使えば簡単。FF側には「JSSH」というアドオンを入れるだけ。
http://wiki.openqa.org/display/WTR/FireWatir

以下サンプルコード

require 'rubygems'
require 'firewatir'

browser = FireWatir::Firefox.new
# googleへ遷移
browser.goto("http://www.google.co.jp/")
# nameがqのテキストボックスに「you tube」と入力
browser.text_field(:name, "q").set("you tube")
# 一番最初のformをsubmit
browser.form(:index ,1).submit

browser.close

しかもありがたいことにlinuxでも動作する。
これがあれば簡単にjsが動くクローラーを作れる。

もちろんhtmlを抜くことも、ボタンを押すことも可能。


# name属性が「date」なセレクトボックスで「今日」を選択
browser.select_list(:name, "date").select "今日"
# name属性が「check」なチェックボックスでチェック
browser.checkbox(:name, "check").set
# idが「submit」なボタンをクリック
browser.button(:id, "submit").click
# htmlを取得
html = browser.html

これは本当に便利。