塩焼きブログ

塩焼きに関しての研究内容を公開しています

Rubyで外部のWebサイトのコンテンツを取得する

Rubyで外部のWebサイトのコンテンツを取得するにはNet::HTTP.get_responseを利用する

require 'net/http'
require 'uri'

response = Net::HTTP.get_response(URI.parse("http://example.com"))
if response.code == "200"
  puts response.body
end

response.coderesponse.bodyといったインスタンスメソッドにはbody, entity, code, header, response, http_version, message, valueがあり、これらはRubyのリファレンスを参考にする。 class Net::HTTPResponse

ヘッダ情報のcache-controlなど取得できる情報は下記の通りである

require 'net/http'
require 'uri'

response = Net::HTTP.get_response(URI.parse("http://example.com"))
response.each do |key,r|
  puts "response['#{key}']"
end

# response['accept-ranges']
# response['cache-control']
# response['content-type']
# response['date']
# response['etag']
# response['expires']
# response['last-modified']
# response['server']
# response['x-cache']
# response['x-ec-custom-error']
# response['content-length']