トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS   ログイン

Zed Scripts の変更点

#author("2022-08-07T13:17:03+09:00","default:fujioka","fujioka")
#author("2022-08-17T16:07:17+09:00","default:fujioka","fujioka")
[[Zed Watching]] | [[Zed]] | [[Kioku]]
-スクリプト特別ルール([[Zed]]を参照)を利用して、[[Zed]]上で動作することも目的としたスクリプト
--[[TSNETスクリプト通信第6号]]の「Zed入門 II - Twitter on Zed」掲載スクリプト
---[[twemo2.pl]]
---[[zed2twitter.pl]]

-Zedの編集用スクリプト
--YouTubeの文字起こし(英文)をZed上にコピペして機械翻訳に掛けるための編集 (2022-08-07)
 #!/Perl/bin/MSWin32-x86-object/jperl.exe
 # Title = ytmoji.pl
 # Input
 # Output
 #binmode STDOUT;
 $| = 1;# for Zed
 $outsw = 1;
 while(<>){
     if (index($_, "\x1A") > -1) {
         last;# EOF
     }
     chomp;
     s/  / /g;
     s/ +$//;
     s/…/\.\.\./g;
     s/’/'/g;
     s/”/"/g;
     s/(\w)\?(\w)/$1\-$2/g;
     if(/[\.\?\!]$/){
         print $_, "\n";
         $outsw = 1;
     }elsif(/^\d+:\d+$/){
         if($outsw == 1){
             print $_, "\n";
             $outsw = 0;
         }else{
             next;
         }
     }else{
         print $_, " ";
     }
 }
※YouTubeの文字起こしは便利だが、経過時間文字列が文の途中に入るので翻訳の邪魔になることが多い。行末をチェックしながら、文の途中に入った経過時間文字列を飛ばし、分断されている文字列を半角空白を挟んで繋ぐ、その他、クォーテーションなどが全角になってしまうのを半角に変換したり、半角空白の複数の並びを一つに変換する。UTF-8のハイフンはSJISで「?」に文字化けするので、SJISのハイフン(マイナス記号)に置換する。

※2 実際、文字起こしの英語の文の区切りは一定ではなく、ピリオドなどがない場合がある。したがって、このスクリプトの適用性は一般的とは言えない(2022-08-17)