2007年07月17日

feedmeterランキング取得 API for JSONPを作ってみたが・・・ このエントリーをはてなブックマークに追加

こんにちは、三遊亭楽麻呂です(嘘です)。

RSS フィード メーター - ランキング の情報を取得する手段として Do You PHP はてな - PEAR::Services_FeedMeter作ってみた ってのがあったのだが、よくわからなかったので、スクレイピングしてJSON形式で現在の順位とRSSのURIを返すようなものを自分で作ってみた。
下記にその使用例などを記載してみる。

パラメータ説明

end point URL:
http://www.usamimi.info/~ryouchi/feedmeter/index.php
パラメータ:callback
コールバック関数名を指定
戻り値
このリンクのような戻り値になる。(rankとRSSfeedのURIのペア)

使い方

callback関数:viewfeedmeter()
の場合、
http://www.usamimi.info/~ryouchi/feedmeter/index.php?callback=viewfeedmeter
などと指定する。

うーむ。できることはわかったが、作ってみて何が嬉しいのか不明だったりする・・・orz


posted by りょーち | Comment(0) | TrackBack(0) | Web周辺技術

2007年07月13日

Web魚拓にキャッシュされているかどうかを調べる方法 このエントリーをはてなブックマークに追加

こんにちは、恩田レイ子こと室井滋です(嘘です)。

先日 ウェブ魚拓 を少し使ってみたのだが、なかなか素晴らしい。
で、Web魚拓内に掲載されているサイトを調べる方法で何かよい方法がないかなと考えていたのだが、Googleで簡単に調べることができそーである。

例えば、はてな日記でWeb魚拓にキャッシュされている日記を調べるにはGoogleで
などとすればよい。
意外と簡単だった。

特定のサイトをもう少し絞込みたい場合は、
などとすればよさそう。
他のサイトでも同じ方法だな。
などとすればよさそう。

ってことで、メモしとこう。
posted by りょーち | Comment(0) | TrackBack(0) | 自分メモ

2007年07月12日

BLOGの炎上について思う このエントリーをはてなブックマークに追加

こんにちは、白洲次郎です(嘘です)。

インターネット上の情報発信手段として、ブログというものはかなり定着してきたと思う。ソーシャルネットワークについても同様にかなり認知されており、この二つにより、りょーちのよーな一般の人間でも知らない誰かとコミュニケーションできたりするのでありがたいことである。

言うまでもないが、インターネットの世界では個人が完全に特定されていないため、ブログのコメントや掲示板のコメントなどを見ていると、互いの考え方の相違やちょっとしたボタンの掛け違えなどで荒れているサイトをちらほら見かける。

2ちゃんねるなどの大規模掲示板ではその傾向がかなり強い。
個人で発信するブログがコメントなどにより荒らされている状態を「炎上」というような言葉を使って表現したりしているようである。

コメントによりブログが荒らされたらどうしましょうか?

ブロガーの取る手段として思いつくのは、
  1. コメント欄で反論(若しくはゴメンネと謝ったりする)
  2. 炎上を避けるために記事を削除(またはブログを削除)
  3. そのまま放置しておく
などかと思います。

3の場合はさておき、1と2を実施すればとりあえず見た目の被害は収まるのではないかとふと考えたりしていた。

しかし、どうもそうではないらしい。
勿論2チャンネルなどに取り上げられるというケースもあるとは思うが、ソーシャルブックマークのコメントによる炎上というのもどうやらあるらしい。

最近ブックマークのコメントで炎上しかけているサイトとしてはこんなのがあるらしい。内容はともかくとして、シロクマ日報のサイト管理者は、当該記事のコメント欄の削除や記事の削除はできるとしても、はてなブックマークのコメントは削除できないよーな気がする。

ブログのコメントは記事を書いた人のモノだが、ソーシャルブックマークのコメントはブックマーカーのモノであることを気づかされた。

記事を削除してもWeb魚拓などで、記事は保管されている場合が多いので更に話しは複雑になってくる。こういうWebアーカイバは例えば、こんなときにも利用される。

金田美香さんのブログの写真と中澤聡太さんのブログで同じ写真が利用されていて、二人の関係が云々というよーな記事があったが、中澤聡太さんのサイトの記事は削除されているにも関わらず、下記のようにWeb魚拓で確認できたりする。うーむ。金田美香さんと中澤聡太さんの場合は炎上ではないのですが、自分の知らないところで2チャンネルに曝されたり、アーカイブされたり、ソーシャルブックマークによりコメントされたりとなると、もう打つ手がないように思われる。

りょーちのサイトは弱小ブログ且つ特に影響力を持つ発言なども皆無なので、こういうことは気にしなくてもよいとは思うので、まあ引き続き細々と適度に書いてみたいと思います(ないと思いますが、荒らさないでね)。
posted by りょーち | Comment(0) | TrackBack(0) | 自分メモ

2007年07月10日

「phpによるスクレイピング処理入門」に為替レート取得方法を追加 このエントリーをはてなブックマークに追加

こんにちは、「だいじょうぶマイ・フレンド」でお馴染みの乃生佳之です(嘘です)元ジャニーズです。

細々とやっている phpによるスクレイピング処理入門 にサンプルをひとつ追加してみたっす。

動作するサンプルは下記になるっす。

為替レート取得のためのAPIを探していたのだが、なんだか見つからなかったので ひまわり証券株式会社 ブログパーツ FXレートウォッチャー の情報をスクレイピングしてみたっす。

情報を見るだけなら、上記のブログパーツでよさそーな気がするけど、その情報をプログラム内で利用したい場合は、やっぱ、スクレイピングする必要がありそーだ。

上記サイトに説明が記載されているので、大凡どんなことをやっているかがわかると思われる。
というか為替レートのAPIってないのかなぁ。
xmethods とか面倒っぽいし・・・
posted by りょーち | Comment(0) | TrackBack(0) | Web周辺技術

2007年07月09日

高野和明:「幽霊人命救助隊」 このエントリーをはてなブックマークに追加

幽霊人命救助隊
幽霊人命救助隊
posted with amazlet on 07.07.09
高野 和明
文藝春秋 (2007/04)
売り上げランキング: 151

りょーち的おすすめ度:お薦め度

こんにちは、よしかわ進です(嘘です)。

最近(といっても数年前だが)デビュー作と現在の作風がかなり違って面食らった作家が二人いる。
ひとりは、五十嵐貴久。デビュー作の「リカ」は貴志祐介のようなおどろおどろしさを持っており、「うわ、この人エグイなー」と思ったりしたのだが、日曜のドラマにもなっている パパとムスメの7日間 を見る限りでは、「えっ?こんな作風だっけ?」とちょいとビックリしてしまった。

で、もう一人が、高野和明である。「13階段」や「グレイヴディッガー」で割と重めの作風だった(と思われる)作者が書いたこの「幽霊人命救助隊」を読んでちょいと驚いた。
自殺してしまった浪人生の裕一は、死後の世界のような臨死体験をした。そこでは、天国と地獄の協会のような場所で、八木というさえない中年男性、美晴という若い女性、市川という元ヤクザのおじさんが存在していた。
彼らは天国でも地獄でもないこの世界に死んでからずっといるようであった。
裕一と彼らの共通点は何れも自殺で死んだことのようである。そこに、神様が(この神様ホントにお気楽な神様なんだが)降りてきて「現世にいる自殺志願者を100人救助しなさい」と彼らに告げた。

どうやら、100人の自殺志願者を助けると現世に戻れるようである。自殺者救助に要する時間は7週間(49日?)。
そして、彼ら幽霊達の人命救助が唐突にスタートするのだ・・・

うーむ。なかなか面白かった。
自殺志願者を助けるために神様から授かった道具は4人の仲間同士で連絡を取り合うためのトランシーバと救助人数をカウントするカウンター。そして自殺者を呼び止めるための拡声器(メガホン)のみ。

彼らは、実世界のモノに直接触れることができないという制約があり、そこが本書を面白くさせている要因だったりする。幽霊ってわりと人を超越した存在だったりするような気がしたのだが、移動手段は電車だったり、バスだったりと公共交通機関を使い、自殺志願者に向ってメガホンで自殺志願者を説得する。この説得も自殺志願者に、直接的な働きかけは然程できず、せいぜい昔のことを思い出させたりする程度である。

テーマとしては非常に重いテーマだが、かなりライトに書かれており、エンターテイメント小説として不謹慎かもしれないが楽しめる一冊である。
最後の救助者はかなり難易度が高かったが、それを乗り越える彼ら4人も人として(幽霊として)ステップアップしたよーである。
しかし、本書を読み「こんなに自殺志願者がいるのかー」と思ってしまうのは私だけでしょうか?
だが、メーターが黄色や青色の人は結構いるのかもしれないっすね。

最近出版された 6時間後に君は死ぬ はどうなのかな。ちょいと気になるっす。

■他の方々のご意見(結構好評だな)
posted by りょーち | Comment(0) | TrackBack(1) | 読書感想文

2007年07月05日

DailyMotion の動画をダウンロードするブックマークレットを作ってみた このエントリーをはてなブックマークに追加

こんにちは、南果歩です(嘘です)。

動画サイトといえば YouTube だったりすると思われるのだが、最近気に入っているサイトでは Dailymotion かな。

少し前に Youtubeの動画(FLV)をダウンロードする方法がわかった で Youtube のダウンロード用サイトを作ってみたのだが、いろいろ調べてみると、どうやら Dailymotion でも同じようにダウンロードすることができそうな気がしたので作ってみたっす。

上記URLには、以下のようなブックマークレットが置いてあるのでこれを利用すればよいっす(上のサイトに掲載しているのと同じものです)。
Get DailyMotion File
(右クリックでお気に入りに追加してください)
(一部修正07/07/09)

で、どーやって使うかといえば Dailymotion のサイトでテキトーに動画を見ていて、「あ、この動画をローカルにダウンロードしたいな」という欲求が沸き起こった際に、上記ブックマークレットを実行するっす。
すると、ダウンロードサイトにて、動画をダウンロードするためのURLのリンクが表示されます。これを右クリックでファイルとして保存すれば、よろしいです。Dailymotion の動画は YouTube と同じように、Flash Video (FLV)ファイル形式 なので、Riva FLV Player などを利用して保存した動画を見ることができるっす。

なお、Daily Motionのダウンロードはセッションが切れているとだめなよーなので、ダウンロード時は Dayly Motion の接続が切れていないかを確認してみてください。

動画系のダウンロードは、ソフトウェアなどが出ているっぽいがインストールするのが面倒な人にはこのブックマークレットで十分だと思われるっす。

ちなみに、このダウンローダも phpによるスクレイピング処理入門 で書かれていることを応用して作ったものです。

うーむ、スクレイピングの技術さえあれば、たいていのことは出来そうな予感っす。(謎)。
posted by りょーち | Comment(7) | TrackBack(0) | Web周辺技術

2007年07月04日

色んな言語でルビを振るブログパーツ このエントリーをはてなブックマークに追加

こんにちは。石川優子です(嘘です)。

通りすがりの語学好きさんより YOMOYOMO - nihonho wo yomo というサイトを教えて貰った。
このサイトは、形態素解析エンジン言語郎 を利用して作成されたサイトで、日本語のサイトのURLを指定すると、日本語のサイトにルビを振ってくれるようである。

サイトの目的としては、日本語を勉強しはじめた外国の方々のために使われるのであろう。

で、自分のサイトに、これを使ってルビを振るブログパーツを作ってみた。こんな感じで設置すればよいっす。

<script type="text/javascript" src="https://ryouchi.up.seesaa.net/rubi/rubi.js" charset="utf-8"></script>


貼り付けた結果はこんな感じ。



対応しているルビの種類は、下記5種類。
  • ひらがな
  • ローマ字
  • ハングル
  • デーヴァナーガリー
  • キリル

国際的なサイトを目指している方にお薦めかな?(ちょっと嘘つきました)。
posted by りょーち | Comment(0) | TrackBack(0) | Web周辺技術

2007年07月03日

「phpによるスクレイピング処理入門」にはてなフォトライフのサンプルを追加 このエントリーをはてなブックマークに追加

こんにちは、エスパー清田こと清田益章です(嘘です)。

昨日作成した phpによるスクレイピング処理入門 の項目に はてなフォトライフ の画像をスクレイピングして表示するようなサンプルを作って見ました。

説明は下記になります。

動作するサンプルは下記になります。

必要なソースは下記3つになるっす。
上記サイトに説明が記載されているので、大凡どんなことをやっているかがわかると思われる。コメントなどをソースに記載しているので、長々と記載しているよーに見えるが、わりとシンプルな構造になっていると思われる。

$node->id == TIDY_TAG_A
$node->id == TIDY_TAG_IMG
$node->attribute
$node->child[0]->value

あたりを覚えておけば、殆どのことはできそーである。

はてな系のサイトはHTMLのソースコードがわりとキレイなので、スクレイピングしやすくてよいっすね。

posted by りょーち | Comment(0) | TrackBack(0) | Web周辺技術

2007年07月02日

「phpによるスクレイピング処理入門」を書いてみた このエントリーをはてなブックマークに追加

こんにちは、バーブ佐竹です(嘘です)。

りょーちのこのサイトではphpによるプログラムを幾つか紹介したりしているのですが、一発モノが多く、体型立てて説明することがあまりないので、ちょいと説明用のサイトを作ってみた。

で、第1回目はいきなりハードル高いですが「スクレイピング処理」について書いてみることにした。

このサイトでも「スクレイピング」という言葉はたまに利用しているのだが、もう一度整理してみると、APIが提供されていないWebサービスもバックグラウンドにデータベースなどがあるはず。で、そのWebサービスはデータベースから読み込んで機械的にデータを「あるパターン」に流し込んでサイトを作成しているであろう。

なので、目に見える部分(表示されているHTMLファイル)を解析し、必要なデータのみを取得して、自前のサーバ側で再度加工して、提供するようなことができると思われる。このことを「スクレイピング(scraping)」というらしい。
ちなみに、scrapeは「削る」って言う意味なので、必要な部分を削り取って利用するってことっすね。

一見難しそうに見えますが、やっていることはHTMLファイルを取得して、パターン(規則性)を見出し、加工するってことです。

下記にphpを利用するユーザにtidy関数を用いたスクレイピング処理の簡単なプログラミングについて解説したサイトを作ってみました。



りょーち自身、スクレイピング処理について体型立てて説明されたサイトがあまりないので、殆ど独学なのであるが、まあ、入門用のサイトとして利用いただければと思うっす。

なるべく、基本概念だけ記載し、ソースを表示したり、実際稼動するプログラムを掲載したりしたので、なんとなく分かる人には分かると思われる。

上記サイトでは Tidy 関数マルチバイト文字列関数 (mbstring) の2種類を主に利用しているが、肝の部分はTidy関数であろう。

HTMLファイルを取得し、tidyオブジェクトを作成し、解析するという流れで記載してあるので、はじめての人にも(多分)分かりやすいのではないかと(勝手に)想像するっす。
上記サイトの例として取り上げたのは「はてなブックマーク」のトップページの「最近の人気エントリー」を表示するプログラムにしてみたっす。



上記サイトを読めば、こんなプログラムも10分くらいで作成できると思われる。
(はてなのサイトはとてもキレイにコーディングされているのでスクレイピングしやすいサイトの一つと言えるであろう)。

ちなみに、りょーちが Tidy 関数を利用して作成してみたサイトは下記の通り。



これらのプログラムも phpによるスクレイピング処理入門 をお読みいただければ、多分「あー、こんなことやってるんだねぇ」と推測でき、且つ、自分で同じようなもの(というかもっと素晴らしいもの)を作ることができると思われます。

なんかかっちょいいの作ったら教えてください。

なお、スクレイピング対象として、取り上げて欲しいサイトなどがあったら、上記サイトに例として作成しようと思うので、コメントなどいただければと思います。

よろしくばい。
posted by りょーち | Comment(2) | TrackBack(0) | Web周辺技術
×

この広告は180日以上新しい記事の投稿がないブログに表示されております。