👉 テキストデータ活用術 とは
2023/12/18-
このサイトは特別なソフトウェアなしで、誰でもどこでも読める文字である テキストデータの活用法を考える場所です。 テキストデータは、人間が目でみて文字として読みとれる点で、 音楽や画像のようなバイナリーデータとはちがいます。
とはいえ、事はそう簡単ではありません。 テキストといっても、UTF-8 や Shift_JIS といった文字コード、 html, tex, csv などといったフォーマットがあるからです。 そうした形式、あるいは無形式のテキストデータをどう活用すればいいのでしょう。
そこに出てくるのが、UNIX 由来の Perl や Python といったツールによる スクリプトと呼ばれる簡易プログラムを使う処理方法です。 これを使うことで、大量のテキストがまるで魔法のように、 瞬時に処理され、望んでいた検索や書き換えの結果を手に入れられます。
ここでは、まずテキストを扱うための環境づくりについてふれ、 さらにテキストデータ処理のさまざまな具体例をみていきます。 これが習得できれば、それは究極の書斎術といえるのではないでしょうか。
🕥 更新情報
- 2024/04/20
- 大学入試DB聞け単!を開始しました。
- 2024/02/16
- 書籍版『テキストデータ活用術2』を出版しました。
- 2023/12/18
- 「テキストデータ活用術」を開始しました。
ツィート |