Tag Archives: 急上昇ワード

Google急上昇ワードをRubyで取得してみる

急上昇ワード取得用URL
http://www.google.co.jp/m/services/trends/get

このURLに[openuri]アクセスしてXMLで取得したレスポンスを[hpricot]でパースするだけ。

XMLのサンプル。
(なぜかこのとき「恥骨」が1位)

<rtt version="1.0"> 
  <update>2010-08-24T22:30:05-07:00</update> 
  <language>ja</language> 
  <country>jp</country> 
  <item> 
    <query>恥骨</query> 
    <rank>1</rank> 
    <score>2157.00</score> 
    <snippet src="http://ja.wikipedia.org/wiki/%E6%81%A5%E9%AA%A8">恥骨(ちこつ)(英名pubis)(羅名pubis、os.pubis)は、四肢動物の腰帯を構成する骨 の一つである。 ...</snippet> 
    <landing_page url="http://www.google.com/search?trndsrc=zeitgeist&amp;trndrnk=1&amp;trndutm=4c74aa5d&amp;trndscr=2157&amp;q=%E6%81%A5%E9%AA%A8&amp;gl=jp&amp;hl=ja&amp;lr=lang_ja"/> 
  </item>
</rtt>

そしてキーワードを取得して、とりあえず配列に突っ込むサンプル

require 'hpricot'
require 'open-uri'

words = Array.new

#APIからすべての内容を取得
all = Hpricot(open("http://www.google.co.jp/m/services/trends/get"))
#ワードのみを取り出す
(all/:query).each do |link|
  word = "#{link.inner_html}"
  words.push(word)
end