作者: davi
日時: 2008/6/30(05:34)
Bruce.さん  <  こん??は でび です

On Sun, 29 Jun 2008 23:48:18 +0900
"Bruce." <kbk@...> wrote:

> > 自分だけではなかろうに…」と「そんなに特殊な希望なの?これ?」
> > との狭間で、不思議な感じがします。

> Matz を説得する方法のスライドがすばらしい件 - TokuLog 改めB日記
> http://d.hatena.ne.jp/tokuhirom/20080629/1214717545

|自分がすごい重要な問題だとおもっていても、作者にとっては
|瑣末な問題、ということがよくあります。

この辺の見極めが難しいですよね。

lemmaの話を出したのは無駄に話題が大きくなって
しまって、マズかったかも、と反省しています。

> MSORT
> http://billposer.org/Software/msort.html

漢数字表記を実数に展開してSortする機能が強調されていますが、

|For each key an effectively unlimited number of 
|multigraphs (sequences of characters to be treated
|as a single unit for purposes of sorting, "collating
|elements" in Unicode parlance) of effectively unlimited
|length may be defined. 

つーことは、文字列についても任意の順序指定ができる、
と読み取って良いのかな?

あ、でも残念ながらwin32なバイナリは無いみたいですね。

MinGWでコンパイルとかの必要がある、と。
ちと腰を据えてやる時間を作らねばならなそうです。


> Collation - Wikipedia, the free encyclopedia
> http://en.wikipedia.org/wiki/Alphabetical_order
> 
> Lexicographical order - Wikipedia, the free encyclopedia
> http://en.wikipedia.org/wiki/Lexicographic_order

そこからUnicode collation algorithmと、International
Components for Unicode (ICU) へ行きました。

ICUはIBMがやっているUnicodeを各ロケール毎に便利に
対応させるプロジェクトのようですね。

各種文字コード規格を混ぜ合わせたのがUnicodeだから、
各ロケールの粒度で処理したいときには扱いにくい、
という認識は技術者の側にも存在する、ということが
わかりました。

でび  http://davi.txt-nifty.com/1984/