スマートフォン専用ページを表示
駄文と書評
主にミステリー系の書評と駄文を書き散らかしてみる。たまにphpで適当なプログラムを書いたりするかも。
<<
鷹の祭典全勝敗(ソフトバンクホークス)
|
TOP
|
ランダムにかわいい猫を表示するJavascript ( via The Old Reader )
>>
2013年07月04日
PDFファイルのテキストだけを抜き出すStamplin Web API
PDF Text Extractor : Stamplin | Rest API
これは面白いな。
PHPのコードをローカルの
xampp
で動かしてみたところあっさり動いた。
手元にあるPDFファイルで試したところ、日本語もきちんと抽出できた。
結果がJSON形式で[texts]の中に1行づつ戻ってくるので処理もしやすそうですな。
注意として
The PDF file should be smaller than 1 Mbyte
No more than 1 request per minute (with a burst of 5 requests)
だそうです。
posted by りょーち |
Comment(0)
|
TrackBack(0)
|
Web周辺技術
この記事へのコメント
コメントを書く
お名前:
メールアドレス:
ホームページアドレス:
コメント:
スポンサードリンク
過去記事検索
profile
名前:りょーち
ウェブサイトURL:
http://ryouchi.seesaa.net/
一言:よろしくね。
最近のエントリー
(08/27)
PowerShellを起動するとconda.exeのエラーが表示されるのを改善する方法
(04/21)
Anacondaをアンインストールした後コマンドプロンプトが起動しなくなった時の解決方法
(01/10)
Windows 10にWSL2環境のUbuntu 20.04 LTSをインストールするメモ
(05/15)
Windows Ubuntu でrootのパスワードを設定する方法
(01/27)
パスワードリマインダーでパスワードそのものをメールで送ってくるサイト 2019年版
(07/22)
これはひどい HGの嫁 住谷杏奈の薦めるKUROJIRUのサイトでヤラセ発見 #kurojiru
(05/01)
Windows 10 1803に更新後にホームグループがなくなります
(03/10)
Windows 10にDebian GNU/Linuxをインストールしてみる
(02/04)
コインチェックで盗まれた仮想通貨NEMの送金アドレス NC4C6PSUW5CLTDT5SXAGJDQJGZNESKFK5MCN77OG を見てみた
(11/01)
ソフトバンクのメール宛にスパムメール送信している奴のwhoisを調べてみた
最近のコメント
Windows 10にWSL2環境のUbuntu 20.04 LTSをインストールするメモ
⇒ 言霊 (06/09)
Anacondaをアンインストールした後コマンドプロンプトが起動しなくなった時の解決方法
⇒ ふく (06/08)
⇒ (01/24)
パスワードリマインダーでパスワードそのものをメールで送ってくるサイト 2019年版
⇒ 師子乃 (03/11)
Windows Ubuntu でrootのパスワードを設定する方法
⇒ りょーち (12/05)
⇒ 師子乃 (12/05)
ヘンリー・ウィンターフェルト:「星からきた少女」
⇒ りょーち (11/28)
⇒ らら (11/28)
リンク
phpによるスクレイピング処理入門
カテゴリ
総記事数:
件
読書感想文
(
187
)
セキュリティ
(
45
)
CISA
(
4
)
海外オモシロネタ
(
382
)
Web周辺技術
(
411
)
自分メモ
(
350
)
気になるサイト
(
100
)
ゲーム
(
8
)
書籍全般
(
30
)
その他
(
101
)
書籍映像化
(
24
)
忘れかけた過去
(
20
)
音楽CD
(
13
)
bookmarklet作成
(
17
)
駄文:SPAM
(
34
)
アフィリエイト
(
48
)
iPhone
(
2
)
Vivaldi
(
4
)
過去ログ
2021年08月
(1)
2021年04月
(1)
2021年01月
(1)
2019年05月
(1)
2019年01月
(1)
2018年07月
(1)
2018年05月
(1)
2018年03月
(1)
2018年02月
(1)
2017年11月
(1)
2017年09月
(1)
2017年07月
(1)
2017年03月
(2)
2017年02月
(3)
2017年01月
(2)
2016年07月
(2)
2016年06月
(2)
2016年03月
(5)
2016年02月
(5)
2016年01月
(1)
2015年12月
(3)
2015年11月
(1)
2015年10月
(1)
2015年09月
(1)
2015年08月
(5)
2015年07月
(1)
2015年06月
(1)
2015年05月
(2)
2015年04月
(1)
2015年03月
(6)
2015年02月
(7)
2015年01月
(3)
2014年12月
(3)
2014年11月
(3)
2014年10月
(4)
2014年09月
(6)
2014年08月
(7)
2014年07月
(4)
2014年06月
(5)
2014年05月
(6)
2014年04月
(4)
2014年03月
(7)
2014年02月
(8)
2014年01月
(3)
2013年12月
(4)
2013年11月
(14)
2013年10月
(11)
2013年09月
(17)
2013年08月
(6)
2013年07月
(9)
2013年06月
(6)
2013年05月
(10)
2013年04月
(10)
2013年03月
(7)
2013年02月
(7)
2013年01月
(5)
2012年12月
(11)
2012年11月
(5)
2012年10月
(3)
2012年09月
(8)
2012年08月
(5)
2012年07月
(5)
2012年06月
(6)
2012年05月
(7)
2012年04月
(5)
2012年03月
(7)
2012年02月
(3)
2012年01月
(6)
2011年12月
(3)
2011年11月
(7)
2011年10月
(9)
2011年09月
(12)
2011年08月
(9)
2011年07月
(9)
2011年06月
(7)
2011年05月
(23)
2011年04月
(17)
2011年03月
(17)
2011年02月
(15)
2011年01月
(12)
2010年12月
(10)
2010年11月
(9)
2010年10月
(20)
2010年09月
(24)
2010年08月
(8)
2010年07月
(7)
2010年06月
(9)
2010年05月
(15)
2010年04月
(13)
2010年03月
(11)
2010年02月
(15)
2010年01月
(26)
2009年12月
(16)
2009年11月
(20)
2009年10月
(20)
2009年09月
(19)
2009年08月
(26)
2009年07月
(12)
2009年06月
(13)
2009年05月
(15)
2009年04月
(10)
2009年03月
(28)
2009年02月
(26)
2009年01月
(20)
2008年12月
(19)
2008年11月
(29)
2008年10月
(32)
2008年09月
(17)
2008年08月
(19)
2008年07月
(8)
2008年06月
(16)
2008年05月
(15)
2008年04月
(26)
2008年03月
(19)
2008年02月
(13)
2008年01月
(11)
2007年12月
(16)
2007年11月
(19)
2007年10月
(28)
2007年09月
(22)
2007年08月
(15)
2007年07月
(19)
2007年06月
(12)
2007年05月
(16)
2007年04月
(18)
2007年03月
(21)
2007年02月
(11)
2007年01月
(16)
2006年12月
(16)
2006年11月
(16)
2006年10月
(12)
2006年09月
(14)
2006年08月
(8)
2006年07月
(15)
2006年06月
(15)
2006年05月
(17)
2006年04月
(18)
2006年03月
(23)
2006年02月
(17)
2006年01月
(19)
2005年12月
(19)
2005年11月
(19)
2005年10月
(18)
2005年09月
(20)
2005年08月
(16)
2005年07月
(17)
2005年06月
(15)
2005年05月
(15)
2005年04月
(19)
2005年03月
(16)
2005年02月
(12)
2005年01月
(11)
2004年12月
(14)
2004年11月
(15)
2004年10月
(23)
2004年09月
(60)
2004年08月
(9)
Seesaa
ブログ
RSS 1.0
RSS 2.0