Bruce.さん < こん??は でび です
On Sun, 29 Jun 2008 23:48:18 +0900
"Bruce." <kbk@...> wrote:
> > 自分だけではなかろうに…」と「そんなに特殊な希望なの?これ?」
> > との狭間で、不思議な感じがします。
> Matz を説得する方法のスライドがすばらしい件 - TokuLog 改めB日記
> http://d.hatena.ne.jp/tokuhirom/20080629/1214717545
|自分がすごい重要な問題だとおもっていても、作者にとっては
|瑣末な問題、ということがよくあります。
この辺の見極めが難しいですよね。
lemmaの話を出したのは無駄に話題が大きくなって
しまって、マズかったかも、と反省しています。
> MSORT
> http://billposer.org/Software/msort.html
漢数字表記を実数に展開してSortする機能が強調されていますが、
|For each key an effectively unlimited number of
|multigraphs (sequences of characters to be treated
|as a single unit for purposes of sorting, "collating
|elements" in Unicode parlance) of effectively unlimited
|length may be defined.
つーことは、文字列についても任意の順序指定ができる、
と読み取って良いのかな?
あ、でも残念ながらwin32なバイナリは無いみたいですね。
MinGWでコンパイルとかの必要がある、と。
ちと腰を据えてやる時間を作らねばならなそうです。
> Collation - Wikipedia, the free encyclopedia
> http://en.wikipedia.org/wiki/Alphabetical_order
>
> Lexicographical order - Wikipedia, the free encyclopedia
> http://en.wikipedia.org/wiki/Lexicographic_order
そこからUnicode collation algorithmと、International
Components for Unicode (ICU) へ行きました。
ICUはIBMがやっているUnicodeを各ロケール毎に便利に
対応させるプロジェクトのようですね。
各種文字コード規格を混ぜ合わせたのがUnicodeだから、
各ロケールの粒度で処理したいときには扱いにくい、
という認識は技術者の側にも存在する、ということが
わかりました。
でび http://davi.txt-nifty.com/1984/