2006年09月15日

ページにルビを振るbookmarklet(とブログパーツ?) このエントリーをはてなブックマークに追加

中文日文 というページで日本語のページにひらがなのルビを振るという機能があったので早速やってみた。多少間違いはあるものの中国の方が日本語の勉強をする際には問題ないレベルで表示された(素晴らしい)。

#CGIのURLが変更になっていたのを修正した(2007/7/4)

で、これのブックマークレットを作ってみた。

ルビを振る 右クリックでお気に入りに追加

ブックマークレットのデフォルトの文字コードはUTF-8です。
何も表示されなければ、そのページの文字コードはUTF-8ではないっぽいので、上部に
(Please select the correct encoder: Japanese(Shift-Jis) Japanese(EUC) UTF-8 )
とか表示されるので、それっぽい文字コードのリンクをクリックしてください。

これを使えば、産総研:ニュースもこんな感じに(^^;

ちなみに、この「りょーちの駄文と書評」のルビ振りバージョンはこんな感じです。
小学生でも読める「りょーちの駄文と書評」

ルビ振り用のproxyサーバがたまにコケることがあり、「BAD proxy」を表示してしまうときがあるのだが、どういうタイミングでコケるのかは不明じゃ。

ブックマークレット起動時に今表示しているページの文字コードを取得して表示を切り替えることができると更に便利なのだが、無理・・・orz

更にルビ振り用のブログパーツ(というかリンク)も作ってみた。

下記をブログのとこかにおいておけば、「ルビを振る」をクリックすると新規ウィンドウにルビ付きのページが表示されるっぽい。

ブログの文字コードがUTF-8の場合:

<a href="javascript:window.open('http://www.jptranslate.com/cgi-bin/hiragana.cgi?encode=utf-8&url='+document.location);eval();">ルビを振る</a>


ブログの文字コードがShift-JISの場合:

<a href="javascript:window.open('http://www.jptranslate.com/cgi-bin/hiragana.cgi?encode=sjis&url='+document.location);eval();">ルビを振る</a>


ブログの文字コードがEUC-jpの場合:

<a href="javascript:window.open('http://www.jptranslate.com/cgi-bin/hiragana.cgi?encode=euc-jp&url='+document.location);eval();">ルビを振る</a>


うーむ。
posted by りょーち | Comment(2) | TrackBack(1) | bookmarklet作成
この記事へのコメント
外国人向けの多言語ルビ振りサイトが開設されました。ホームページアドレスは、
http://yomoyomo.jp/
です。

好きなページのホームページアドレスさえ入力すれば、自動的にふりがなを振ることが可能です。ふりがなを振るというか5カ国語の文字でルビ振りをすることが可能になっています。

言語郎という形態素解析エンジンを使って、ふりがなを付けることが可能だそうです。
http://gengoro.zoo.co.jp/

ひらがな、カタカナ、ローマ字、ハングル文字、ヒンズー文字(インド文字)、ロシア文字でルビ振りが可能になっています。

処理速度も速いし、精度もかなり高い感じなので、外国人だけでなく、子供や、障害者などに役に立つのではと思います。
Posted by 語学好き at 2007年07月03日 23:43
語学好きさん、こんにちは。
りょーち@管理人です。
コメントいただきましてありがとうございます。

サイトを拝見してみました。
なかなかオモシロそうなサイトですねー。
外部からの読み出しには何らかの制限がありそうなので、もう少し調査が必要ですが、何かオモシロそうなものが作れそうな予感です。
情報ありがとうございました。

ではでは。
Posted by りょーち at 2007年07月04日 17:25
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:


ページにルビを振ってくれるリンクを作成
Excerpt: りょーちの駄文と書評 さんのところで「中文日文」という翻訳サービスを提供している
Weblog: べんじゃみんのココログ
Tracked: 2006-09-17 18:46