👉 テキストデータ活用術 とは

2023/12/18-

テキストデータ活用術  このサイトは特別なソフトウェアなしで、誰でもどこでも読める文字である テキストデータの活用法を考える場所です。 テキストデータは、人間が目でみて文字として読みとれる点で、 音楽や画像のようなバイナリーデータとはちがいます。

 とはいえ、事はそう簡単ではありません。 テキストといっても、UTF-8 や Shift_JIS といった文字コード、 html, tex, csv などといったフォーマットがあるからです。 そうした形式、あるいは無形式のテキストデータをどう活用すればいいのでしょう。

 そこに出てくるのが、UNIX 由来の Perl や Python といったツールによる スクリプトと呼ばれる簡易プログラムを使う処理方法です。 これを使うことで、大量のテキストがまるで魔法のように、 瞬時に処理され、望んでいた検索や書き換えの結果を手に入れられます。

 ここでは、まずテキストを扱うための環境づくりについてふれ、 さらにテキストデータ処理のさまざまな具体例をみていきます。 これが習得できれば、それは究極の書斎術といえるのではないでしょうか。


🕥 更新情報

2024/04/20
大学入試DB聞け単!を開始しました。
2024/02/16
書籍版『テキストデータ活用術2』を出版しました。
2023/12/18
「テキストデータ活用術」を開始しました。

Facebookシェア