🎉 画像のテキスト化など

2022/3/23

🎉 画像テキスト化,Chromebookでの辞書登録  ノートに書いた昔の日記類が大量にあって、読み返してもいなかったんですが、 ふと、この際整理し、できればデジタル化しようと思い立ちました。 しかし、手で入力するとあまりの面倒臭さと重労働とに音を上げてしまいます。 OCRが使えるかもしれないと思いましたが、Windows 対応の、 有料のものが多いので少しひるんでいると、 Google Drive に置けばたちまち活字化してくれるという記事に出会い、 試しにやってみました。


画像のテキスト化(Google Drive)

 その結果、縦書きだろうが、横書きだろうが、 画像データを自動でテキスト化してくれます。 あまりのあっけなさに驚きました。 体感として、この変換によって直接入力の倍以上は楽ができます。 元が活字データならそれはもう圧倒的な効率です。

 使い方は簡単で、Google Drive 上にアップロードし、 その画像データを右クリックし、 [アプリで開く]-[Googleドキュメント]とするだけです。 数秒で画像を貼り付けたワープロ文書が開き、 その下の方に日本語のテキストが表示されています。 必要な範囲を選択してコピーしたら終わりです。

 ただ、縦書きの手書きは少し苦手のようで、 判読困難なテキストを吐き出すことがあります。 そんなとき、「文章の横に傍線を引く」といいというのを偶然見つけました。 こうすると、傍線が無視され、文字の読み取り精度はぐっと上がるのです。

Chromebook の Emacs で mozc 辞書登録

 少し前、ここで Chromebook に Emacs を入れ、 mozc で日本語入力する方法を紹介しました。 C-i で全角カタカナ、C-n で最初の文節のみ確定など、 ストレスなく変換できるのですが、このままでは辞書登録ができないのが悩みでした。

 試行錯誤すると、次のようにすればできるとわかりました。 親機で使っている辞書を mydic.txt にエクスポートしておきます。 その上で Chromebook の Linux 環境で mozc-utils-gui をインストールします。

$ sudo apt install mozc-utils-gui

次に ~/.profile に以下を追加します。

alias mozc-dic="/usr/lib/mozc/mozc_tool --mode=dictionary_tool"

コマンドを使えるようにするため、ターミナルを開き直します。 ついで、

$ mozc-dic

とやり、tools のリストから mydic.txt を import します。 これで無事、名詞やサ変動詞が使えるようになりました。

mozcの辞書登録(chromebook)
twitterシェア Facebookシェア
🤓
kirayn
2022/3/24
そんな凄い機能が潜んでいたのですか!紹介を感謝します。ありがとう。
スマホやタブレットではGoogleレンズを使っていましたが、.docxになれば汎用性が増します。特にkindle本の執筆にはGoogleドキュメントを使っているので何かと便利になるかも😁
🤓
kirayn
2022/3/24
コメント通知機能を遅ればせながらオンにしたら自分のコメントが送られてきたので推敲ができそうです😁
おかげで日記類のデジタル化がスピーディに進み、過去の自分を小説として再読する作業ができました。
AIっぽい変換だなとは思いましたが、まさか画像から草の名前を知らせてくれるのと同種の機能とは……😅。
🐼
峰山進
2022/3/25
🤓
kirayn
2022/3/26
キーボードで執筆することに慣れて久しいですが、手書きの方がアイデアを考えたりするようなクリエーティブな作業には向いているかも?と思えることがあります。

ですから、手書きのノートにメモをすることは続けていて、それをスマホのカメラで撮影して擬似的なデジタル化をしていますが・・・😁
以下は絵でなく文章の話です。
手書きのよさは下書きの自由さですが、工夫によってPCで可能な上、ヴァリアント管理すらできます。
マルチウィンドウを使えばアウトラインで書くこともできるし、手書きの手法は大抵PCで代替可能です。
PCは縦書を得意としていませんが、書いた後さっと縦書にするなど対策はいろいろあり……気づくともうなぐり書きと署名以外手書きしない生活をしています😅。
🐼
峰山進
2022/3/27
🤓
kirayn
2022/3/28
優秀な学生はノートのとり方がうまいという話を聞いたことがあります。私も学生の頃、アーチェリーに夢中になって講義をサボることが多くて、真面目な友人からノートを借りていましたが、他人のノートを見ると参考になることが多かったです。今は個人情報保護の観点から公開されている情報源がメインですが・・・😁
ノートの取り方というと、口述筆記(1音声入力)、速記(2手書き)が考えられますね。
2は後回しにし、1について考えてみます。

音声入力自体はGoogleドキュメント上で[ツール]-[音声入力]でできます。が、音声ソースが残らないし、ちょっと使いにくいため、一旦m4a等の音声データで保存し、文字起こしする手順を考えます。

PCのスピーカー端子から出た線を強引にマイク端子へ挿します😅。その上でPCにて音声データを再生し、Googleドキュメントの音声入力をONにするとあら不思議、ドキュメント上を文字が流れ出します(音声は自分で朗読したプーシキンの詩)。
「光の夏の傾きに明るい日々は流れさって事なき夜のまどろむ影には冷たい霧が立ち込める……」「音」が「事」と間違ってしまった以外は完璧でした!
🐼
峰山進
2022/3/29
🤓
kirayn
2022/3/29
すごいですね!おそらくは自作のPCだからできるのでしょうが、私は4年前に自作PCからChromebookに乗り換えてから処分してしまいました。おそらくはICレコーダーに録音した音声(SDカード)をオーディオ-USB変換ケーブルでChromebookに入力すればできそうな気がしますが、こういうことはやはりWindowsの方が自由度が高いですな😁
取りあえず動かす方法は、ChromebookのGoogleドキュメントで音声入力をONにし、音声データをスピーカーから直接再生してやることですね。音声がノートから聞こえ続けるのに目をつむれば使えます😅。
私がPCで使っているのは RA-AUD51 というUSBに挿す外付サウンドカードです。Chromebookで使うには TypeA-TypeC 変換コネクタ経由で挿します。あとは音声入力変更方法をネットで検索し、調整すれば使えました。
🐼
峰山進
2022/3/30
🤓
kirayn
2022/4/1
ありがとうございます!kindle本の出版が完了したら試してみたいと思います。2冊目のkindle本は出版納期を3月末と目標を決めて取り組んでいましたが、結局は昨日中までに出版できず落ち込んで・・・いませんが😁
お疲れさま!
私はメモ出力をいろいろ試してました。
Chromebookに「手書きメモ」(Cursive)というアプリがあり、ここから[PDF形式でエクスポート]、Google Drive経由でテキスト化というのがたぶん正統派です。
少し面倒でもっとパッとやれないかと autodraw.com やら何やら試しましたがメモ出力には不要な機能が多く、重いのでWebアプリを自作してしまいました(サイドメニューの「メモ画像出力」)😅。
🐼
峰山進
2022/4/1
    注意点