URLが分かっているが、そのURLのアクセス先のHTMLファイルのタイトル名をどうやって取得すればよいのかわからなかったのだが、mixiで聞いてみたところ、やっとわかった。
tidy関数を利用すればよさそうなことまではわかったのだったが文字化けしてしまうので、どーしよーかと悩んでいたが、tidyでパースする際に文字コードを指定すればよいということがわかった。
で、こんなサンプルをつくってみた。
JSONのデータを表示する
(サンプルはIEのみで動作するっぽい)
(サンプルはIEのみで動作するっぽい)
上記のソースをみてみるとわかるかと思うが、
http://www.usamimi.info/~ryouchi/title/?url=(取得したいURL)
で、下記のようなJSON形式でデータを取得できるっぽい。
{"url":"http:\/\/ryouchi.seesaa.net","title":"\u308a\u3087\u30fc\u3061\u306e\u99c4\u6587\u3068\u66f8\u8a55"}文字コードはUTF-8になってます。
しかし、ここまではわかったが、これを利用する際、ドメインが異なると(クロスドメインのデータを取得していると)だめっぽいのぅ。
うーむ。どーすればよいのか?
謎じゃよ。
ちなみに、これを作ったきっかけは、例のIPCユーザによるコメントスパム報告用のフォームを自動的に作成しようかなと思ったりしたわけである。
先日作成した、アフィリエイトサービスプロバイダ利用チェックにもこの機能を使ってアホアフィリエイターのURLからアホアフィリエイターのサイト名を取得するのに利用しているっす。
ちなみに、phpのTIDY関数を利用して、タイトルタグを取得するphpのソースは下記になる。
index.phps (proxy.phpが必要)
TIDY、最強だな。
