AIを用いて写真からテキストデータを抽出できる軽量ツール「NDLOCR-Lite」が2月24日、国会図書館の実験的なサービスを提供する「NDLラボ」の公式「GitHub」サイトで公開された。ライセンスは「CC BY 4.0」で、ソースコードも公開済み。適切なクレジット表示さえあれば商用を含め自由に利用できる。
生成AIを活用する際は、プロンプトと一緒に渡す情報が重要な役割を果たす。前提条件や文脈を提示することで、本当に必要な出力が得られるからだ。そのため、毎日[Ctrl]+[C]と[Ctrl]+[V]を繰り返す、コピペ祭りが起きてしまっている。 Web ...
画像PDFからテキストを抽出:https://bit.ly/4almxjW PDFから文字を取り出したいのに、「コピーできない」「文字が選択できない」と困ったことはありませんか? 特に、スキャンされたPDFや画像PDFでは、通常のコピー操作ではテキスト抽出ができず、OCR(光学文字認識)を使ったPDF文字起こしが必要になります。 を初心者にも分かりやすく解説します。 1.PDFテキスト抽出の仕組み ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する