* ページの一部が文字化けしてしまう [#haa6d4ae] -ページ: [[質問箱]] -投稿者: [[ねこ丸]] -状態: 完了 -投稿日: 2003-05-21 ** メッセージ [#bc8e0fc8] ねこ丸/PukiWikiスキンなど、ページの一部が文字化けしてます。過去の経験では -xrea.com(PHP 4.3.1 のモジュール版) + 1.4rc2 で文字化けが発生したことがあります。xrea では PHP の動かし方が二種類あるのですが、以下のような感じでした。 , ''ポート'' , ''API'' , ''動作'' ,8080,Apache モジュール,化け ,80,CGI,正常 正確には文字化けではなく、どこかのページへのリンクが混入してきてしまう、という状況です。CGI にしたらうまく動いたのでこれ以上は追求しませんでした(^^; すいません、役に立たない情報で。 rakunet の場合は何が原因なのでしょうね。 ※ 「TSNET の入り口」は、この文言をここに置くのはなんか変だな、という意味です。動作は正常です。 ---- -IE6, Mozilla1.2 では文字化けしません。環境と状況を書いてもらえませんか。TSNET の入口の状況も。ひょっとして Navigator のあるバージョンに生じるバグというものかも。 -- [[閑舎]] SIZE(10){2003-05-21 (水) 09:52:38} -Mozilla 1.3.1, MozillaFirebird 0.6, Netscape 7.0.2 ですべて化けます。IE 5.5 ではさらにひどく、HTML ソースが入り込んできていて、まともな表示にすらなっていません。 -- [[ねこ丸]] SIZE(10){2003-05-21 (水) 09:59:59} -上の発言も途中でおかしな文字列が入り込んでいるようです。なんかどうも決まって[[壁]]へのリンクが紛れ込んできてますね。 -「な」と「表」がくっつくと×。PukiWikiスキンのほうも「壁」となってますね。これが正常かと思った。PHP 本体のバグだとすると関連パッケージを総入れ替えしなければならなくなる可能性もあり、直すのは時間がかかるかも。 -- [[閑舎]] SIZE(10){2003-05-21 (水) 10:35:29} -ちょっと AutoLink にかかわりそうなので、AutoLink を止めてみます。 -- [[閑舎]] SIZE(10){2003-05-21 (水) 10:48:13} -わかった。たぶん、Perl の正規表現マッチにもある、前の漢字の 2 バイト目と後の漢字の 1 バイト目がくっついて誤認識って代物ですね。取りあえず、漢字 1 文字のページを作らなければめったなことで発生しないので、「壁」をリネームします。 -- [[閑舎]] SIZE(10){2003-05-21 (水) 11:01:59} -根本は [[BugTrack/246>http://pukiwiki.sourceforge.jp/dev/?cmd=read&page=BugTrack%2F246]] と同じですね。PHP のバージョンはすぐには上げられないので。 -- [[閑舎]] SIZE(10){2003-05-21 (水) 11:18:26} -よさげな感じですね。自分が試したときは AutoLink は切っていたような…。でも分かりませぬ。まぁ少なくとも現象は収まりましたので、よかったよかった。 -- [[ねこ丸]] SIZE(10){2003-05-21 (水) 11:33:17} -根本的な原因は極悪さんもわかっていると思うけれど EUC の検索ルーチンが PHP 側、あるいは PukiWiki 側で厳密なものになっていないから……なので UTF-8 に PukiWiki システム、データを強引に変更したので解決でしょう。 -- [[閑舎]] SIZE(10){2003-05-28 (水) 00:48:46} -極悪さんが日記で書いているようだけど、PukiWiki の Autolink は n バイト以上と指定できるようになってます(ディフォルトが 1 なだけです)。私の言いたかったのは、AutoLink の問題はページ名を変えるとか、n を 4 以上にするとかで Ok だけれど、同じ検索ルーチンが「単語検索」にも使われていて、これで「朝」とか「壁」みたいな漢字一字を検索すると変なことになる(EUC の場合)ということです。他の PukiWiki サイトは EUC が圧倒的に多く、そこらでこの漢字を検索してみたらわかります。 -- [[閑舎]] SIZE(10){2003-05-28 (水) 11:33:46} -根本的な問題はわかります。僕の wiki も SJIS のくせに正規表現 ok にしてるのでその辺の苦労は想像がつきます。-- [[極悪]] SIZE(10){2003-05-28 (水) 12:21:46} #comment #comment_nospam