ページの一部が文字化けしてしまう†
- ページ: 質問箱
- 投稿者: ねこ丸
- 状態: 完了
- 投稿日: 2003-05-21
メッセージ†
ねこ丸/PukiWikiスキンなど、ページの一部が文字化けしてます。過去の経験では
- xrea.com(PHP 4.3.1 のモジュール版) + 1.4rc2
で文字化けが発生したことがあります。xrea では PHP の動かし方が二種類あるのですが、以下のような感じでした。
ポート | API | 動作 |
8080 | Apache モジュール | 化け |
80 | CGI | 正常 |
正確には文字化けではなく、どこかのページへのリンクが混入してきてしまう、という状況です。CGI にしたらうまく動いたのでこれ以上は追求しませんでした(^^; すいません、役に立たない情報で。
rakunet の場合は何が原因なのでしょうね。
※ 「TSNET の入り口」は、この文言をここに置くのはなんか変だな、という意味です。動作は正常です。
- IE6, Mozilla1.2 では文字化けしません。環境と状況を書いてもらえませんか。TSNET の入口の状況も。ひょっとして Navigator のあるバージョンに生じるバグというものかも。 -- 閑舎 2003-05-21 (水) 09:52:38
- Mozilla 1.3.1, MozillaFirebird 0.6, Netscape 7.0.2 ですべて化けます。IE 5.5 ではさらにひどく、HTML ソースが入り込んできていて、まともな表示にすらなっていません。 -- ねこ丸 2003-05-21 (水) 09:59:59
- 上の発言も途中でおかしな文字列が入り込んでいるようです。なんかどうも決まって壁へのリンクが紛れ込んできてますね。
- 「な」と「表」がくっつくと×。PukiWikiスキンのほうも「壁」となってますね。これが正常かと思った。PHP 本体のバグだとすると関連パッケージを総入れ替えしなければならなくなる可能性もあり、直すのは時間がかかるかも。 -- 閑舎 2003-05-21 (水) 10:35:29
- ちょっと AutoLink にかかわりそうなので、AutoLink を止めてみます。 -- 閑舎 2003-05-21 (水) 10:48:13
- わかった。たぶん、Perl の正規表現マッチにもある、前の漢字の 2 バイト目と後の漢字の 1 バイト目がくっついて誤認識って代物ですね。取りあえず、漢字 1 文字のページを作らなければめったなことで発生しないので、「壁」をリネームします。 -- 閑舎 2003-05-21 (水) 11:01:59
- 根本は BugTrack/246 と同じですね。PHP のバージョンはすぐには上げられないので。 -- 閑舎 2003-05-21 (水) 11:18:26
- よさげな感じですね。自分が試したときは AutoLink は切っていたような…。でも分かりませぬ。まぁ少なくとも現象は収まりましたので、よかったよかった。 -- ねこ丸 2003-05-21 (水) 11:33:17
- 根本的な原因は極悪さんもわかっていると思うけれど EUC の検索ルーチンが PHP 側、あるいは PukiWiki 側で厳密なものになっていないから……なので UTF-8 に PukiWiki システム、データを強引に変更したので解決でしょう。 -- 閑舎 2003-05-28 (水) 00:48:46
- 極悪さんが日記で書いているようだけど、PukiWiki の Autolink は n バイト以上と指定できるようになってます(ディフォルトが 1 なだけです)。私の言いたかったのは、AutoLink の問題はページ名を変えるとか、n を 4 以上にするとかで Ok だけれど、同じ検索ルーチンが「単語検索」にも使われていて、これで「朝」とか「壁」みたいな漢字一字を検索すると変なことになる(EUC の場合)ということです。他の PukiWiki サイトは EUC が圧倒的に多く、そこらでこの漢字を検索してみたらわかります。 -- 閑舎 2003-05-28 (水) 11:33:46
- 根本的な問題はわかります。僕の wiki も SJIS のくせに正規表現 ok にしてるのでその辺の苦労は想像がつきます。-- 極悪 2003-05-28 (水) 12:21:46
#comment_nospam