使用Javascript直接将网页进行简繁转换 转

               

方法之一:
直接在网页中加入下面的JavaScript代码或者另存为一个.js文件,然后引用:

/简繁体转换
//模仿语言包式的简繁转换功能插件!
//Edited by Stardy –2005-04-16 , Web :http://www.stardy.com , QQ:2885465

var Default_isFT = 0  //默认是否繁体,0-简体,1-繁体
var StranIt_Delay = 50 //翻译延时毫秒(设这个的目的是让网页先流畅的显现出来)

//-------代码开始,以下别改-------
//转换文本
function StranText(txt,toFT,chgTxt)
{
 if(txt==””||txt==null)return “”
 toFT=toFT==nullodyIsFt:toFT
 if(chgTxt)txt=txt.replace((toFT简”:”繁”),(toFT繁”:”简”))
 if(toFT){return Traditionalized(txt)}
 else {return Simplized(txt)}
}
//转换文本
function StranText2(txt)
{
 if(txt==””||txt==null)return “”
 if(BodyIsFt==1){return Traditionalized(txt)}
 else {return Simplized(txt)}
}

//转换对象,使用递归,逐层剥到文本
function StranBody(fobj)
{
 if(typeof(fobj)==”object”){var obj=fobj.childNodes}
 else
 {
  BodyIsFt=getCookie(“ft”);
  var obj=document.body.childNodes
 }
 for(var i=0;i {
  var OO=obj.item(i)
  if(“||BR|HR|TEXTAREA|”.indexOf(“|”+OO.tagName+”|”)>0)continue;
  if(OO.title!=””&&OO.title!=null)OO.title=StranText2(OO.title);
  if(OO.alt!=””&&OO.alt!=null)OO.alt=StranText2(OO.alt);
  if(OO.tagName==”INPUT”&&OO.value!=””&&OO.type!=”text”&&OO.type!=”hidden”)OO.value=StranText2(OO.value);
  if(OO.nodeType==3){OO.data=StranText2(OO.data)}
  else StranBody(OO)
 }
}
function JTPYStr()
{
 return ‘皑蔼碍爱翱袄奥坝罢摆败颁办绊帮绑镑谤剥饱宝报鲍辈贝钡狈备惫绷笔毕毙闭边编贬变辩辫鳖瘪濒滨宾摈饼拨钵铂驳卜补参蚕残惭惨灿苍舱仓沧厕侧册测层诧搀掺蝉馋谗缠铲产阐颤场尝长偿肠厂畅钞车彻尘陈衬撑称惩诚骋痴迟驰耻齿炽冲虫宠畴踌筹绸丑橱厨锄雏础储触处传疮闯创锤纯绰辞词赐聪葱囱从丛凑窜错达带贷担单郸掸胆惮诞弹当挡党荡档捣岛祷导盗灯邓敌涤递缔点垫电淀钓调迭谍叠钉顶锭订东动栋冻斗犊独读赌镀锻断缎兑队对吨顿钝夺鹅额讹恶饿儿尔饵贰发罚阀珐矾钒烦范贩饭访纺飞废费纷坟奋愤粪丰枫锋风疯冯缝讽凤肤辐抚辅赋复负讣妇缚该钙盖干赶秆赣冈刚钢纲岗皋镐搁鸽阁铬个给龚宫巩贡钩沟构购够蛊顾剐关观馆惯贯广规硅归龟闺轨诡柜贵刽辊滚锅国过骇韩汉阂鹤贺横轰鸿红后壶护沪户哗华画划话怀坏欢环还缓换唤痪焕涣黄谎挥辉毁贿秽会烩汇讳诲绘荤浑伙获货祸击机积饥讥鸡绩缉极辑级挤几蓟剂济计记际继纪夹荚颊贾钾价驾歼监坚笺间艰缄茧检碱硷拣捡简俭减荐槛鉴践贱见键舰剑饯渐溅涧浆蒋桨奖讲酱胶浇骄娇搅铰矫侥脚饺缴绞轿较秸阶节茎惊经颈静镜径痉竞净纠厩旧驹举据锯惧剧鹃绢杰洁结诫届紧锦仅谨进晋烬尽劲荆觉决诀绝钧军骏开凯颗壳课垦恳抠库裤夸块侩宽矿旷况亏岿窥馈溃扩阔蜡腊莱来赖蓝栏拦篮阑兰澜谰揽览懒缆烂滥捞劳涝乐镭垒类泪篱离里鲤礼丽厉励砾历沥隶俩联莲连镰怜涟帘敛脸链恋炼练粮凉两辆谅疗辽镣猎临邻鳞凛赁龄铃凌灵岭领馏刘龙聋咙笼垄拢陇楼娄搂篓芦卢颅庐炉掳卤虏鲁赂禄录陆驴吕铝侣屡缕虑滤绿峦挛孪滦乱抡轮伦仑沦纶论萝罗逻锣箩骡骆络妈玛码蚂马骂吗买麦卖迈脉瞒馒蛮满谩猫锚铆贸么霉没镁门闷们锰梦谜弥觅绵缅庙灭悯闽鸣铭谬谋亩钠纳难挠脑恼闹馁腻撵捻酿鸟聂啮镊镍柠狞宁拧泞钮纽脓浓农疟诺欧鸥殴呕沤盘庞国爱赔喷鹏骗飘频贫苹凭评泼颇扑铺朴谱脐齐骑岂启气弃讫牵扦钎铅迁签谦钱钳潜浅谴堑枪呛墙蔷强抢锹桥乔侨翘窍窃钦亲轻氢倾顷请庆琼穷趋区躯驱龋颧权劝却鹊让饶扰绕热韧认纫荣绒软锐闰润洒萨鳃赛伞丧骚扫涩杀纱筛晒闪陕赡缮伤赏烧绍赊摄慑设绅审婶肾渗声绳胜圣师狮湿诗尸时蚀实识驶势释饰视试寿兽枢输书赎属术树竖数帅双谁税顺说硕烁丝饲耸怂颂讼诵擞苏诉肃虽绥岁孙损笋缩琐锁獭挞抬摊贪瘫滩坛谭谈叹汤烫涛绦腾誊锑题体屉条贴铁厅听烃铜统头图涂团颓蜕脱鸵驮驼椭洼袜弯湾顽万网韦违围为潍维苇伟伪纬谓卫温闻纹稳问瓮挝蜗涡窝呜钨乌诬无芜吴坞雾务误锡牺袭习铣戏细虾辖峡侠狭厦锨鲜纤咸贤衔闲显险现献县馅羡宪线厢镶乡详响项萧销晓啸蝎协挟携胁谐写泻谢锌衅兴汹锈绣虚嘘须许绪续轩悬选癣绚学勋询寻驯训讯逊压鸦鸭哑亚讶阉烟盐严颜阎艳厌砚彦谚验鸯杨扬疡阳痒养样瑶摇尧遥窑谣药爷页业叶医铱颐遗仪彝蚁艺亿忆义诣议谊译异绎荫阴银饮樱婴鹰应缨莹萤营荧蝇颖哟拥佣痈踊咏涌优忧邮铀犹游诱舆鱼渔娱与屿语吁御狱誉预驭鸳渊辕园员圆缘远愿约跃钥岳粤悦阅云郧匀陨运蕴酝晕韵杂灾载攒暂赞赃脏凿枣灶责择则泽贼赠扎札轧铡闸诈斋债毡盏斩辗崭栈战绽张涨帐账胀赵蛰辙锗这贞针侦诊镇阵挣睁狰帧郑证织职执纸挚掷帜质钟终种肿众诌轴皱昼骤猪诸诛烛瞩嘱贮铸筑驻专砖转赚桩庄装妆壮状锥赘坠缀谆浊兹资渍踪综总纵邹诅组钻致钟么为只凶准启板里雳余链泄’;
}
function FTPYStr()
{
 return ‘皚藹礙愛翺襖奧壩罷擺敗頒辦絆幫綁鎊謗剝飽寶報鮑輩貝鋇狽備憊繃筆畢斃閉邊編貶變辯辮鼈癟瀕濱賓擯餅撥缽鉑駁蔔補參蠶殘慚慘燦蒼艙倉滄廁側冊測層詫攙摻蟬饞讒纏鏟産闡顫場嘗長償腸廠暢鈔車徹塵陳襯撐稱懲誠騁癡遲馳恥齒熾沖蟲寵疇躊籌綢醜櫥廚鋤雛礎儲觸處傳瘡闖創錘純綽辭詞賜聰蔥囪從叢湊竄錯達帶貸擔單鄲撣膽憚誕彈當擋黨蕩檔搗島禱導盜燈鄧敵滌遞締點墊電澱釣調叠諜疊釘頂錠訂東動棟凍鬥犢獨讀賭鍍鍛斷緞兌隊對噸頓鈍奪鵝額訛惡餓兒爾餌貳發罰閥琺礬釩煩範販飯訪紡飛廢費紛墳奮憤糞豐楓鋒風瘋馮縫諷鳳膚輻撫輔賦複負訃婦縛該鈣蓋幹趕稈贛岡剛鋼綱崗臯鎬擱鴿閣鉻個給龔宮鞏貢鈎溝構購夠蠱顧剮關觀館慣貫廣規矽歸龜閨軌詭櫃貴劊輥滾鍋國過駭韓漢閡鶴賀橫轟鴻紅後壺護滬戶嘩華畫劃話懷壞歡環還緩換喚瘓煥渙黃謊揮輝毀賄穢會燴彙諱誨繪葷渾夥獲貨禍擊機積饑譏雞績緝極輯級擠幾薊劑濟計記際繼紀夾莢頰賈鉀價駕殲監堅箋間艱緘繭檢堿鹼揀撿簡儉減薦檻鑒踐賤見鍵艦劍餞漸濺澗漿蔣槳獎講醬膠澆驕嬌攪鉸矯僥腳餃繳絞轎較稭階節莖驚經頸靜鏡徑痙競淨糾廄舊駒舉據鋸懼劇鵑絹傑潔結誡屆緊錦僅謹進晉燼盡勁荊覺決訣絕鈞軍駿開凱顆殼課墾懇摳庫褲誇塊儈寬礦曠況虧巋窺饋潰擴闊蠟臘萊來賴藍欄攔籃闌蘭瀾讕攬覽懶纜爛濫撈勞澇樂鐳壘類淚籬離裏鯉禮麗厲勵礫曆瀝隸倆聯蓮連鐮憐漣簾斂臉鏈戀煉練糧涼兩輛諒療遼鐐獵臨鄰鱗凜賃齡鈴淩靈嶺領餾劉龍聾嚨籠壟攏隴樓婁摟簍蘆盧顱廬爐擄鹵虜魯賂祿錄陸驢呂鋁侶屢縷慮濾綠巒攣孿灤亂掄輪倫侖淪綸論蘿羅邏鑼籮騾駱絡媽瑪碼螞馬罵嗎買麥賣邁脈瞞饅蠻滿謾貓錨鉚貿麽黴沒鎂門悶們錳夢謎彌覓綿緬廟滅憫閩鳴銘謬謀畝鈉納難撓腦惱鬧餒膩攆撚釀鳥聶齧鑷鎳檸獰甯擰濘鈕紐膿濃農瘧諾歐鷗毆嘔漚盤龐國愛賠噴鵬騙飄頻貧蘋憑評潑頗撲鋪樸譜臍齊騎豈啓氣棄訖牽扡釺鉛遷簽謙錢鉗潛淺譴塹槍嗆牆薔強搶鍬橋喬僑翹竅竊欽親輕氫傾頃請慶瓊窮趨區軀驅齲顴權勸卻鵲讓饒擾繞熱韌認紉榮絨軟銳閏潤灑薩鰓賽傘喪騷掃澀殺紗篩曬閃陝贍繕傷賞燒紹賒攝懾設紳審嬸腎滲聲繩勝聖師獅濕詩屍時蝕實識駛勢釋飾視試壽獸樞輸書贖屬術樹豎數帥雙誰稅順說碩爍絲飼聳慫頌訟誦擻蘇訴肅雖綏歲孫損筍縮瑣鎖獺撻擡攤貪癱灘壇譚談歎湯燙濤縧騰謄銻題體屜條貼鐵廳聽烴銅統頭圖塗團頹蛻脫鴕馱駝橢窪襪彎灣頑萬網韋違圍爲濰維葦偉僞緯謂衛溫聞紋穩問甕撾蝸渦窩嗚鎢烏誣無蕪吳塢霧務誤錫犧襲習銑戲細蝦轄峽俠狹廈鍁鮮纖鹹賢銜閑顯險現獻縣餡羨憲線廂鑲鄉詳響項蕭銷曉嘯蠍協挾攜脅諧寫瀉謝鋅釁興洶鏽繡虛噓須許緒續軒懸選癬絢學勳詢尋馴訓訊遜壓鴉鴨啞亞訝閹煙鹽嚴顔閻豔厭硯彥諺驗鴦楊揚瘍陽癢養樣瑤搖堯遙窯謠藥爺頁業葉醫銥頤遺儀彜蟻藝億憶義詣議誼譯異繹蔭陰銀飲櫻嬰鷹應纓瑩螢營熒蠅穎喲擁傭癰踴詠湧優憂郵鈾猶遊誘輿魚漁娛與嶼語籲禦獄譽預馭鴛淵轅園員圓緣遠願約躍鑰嶽粵悅閱雲鄖勻隕運蘊醞暈韻雜災載攢暫贊贓髒鑿棗竈責擇則澤賊贈紮劄軋鍘閘詐齋債氈盞斬輾嶄棧戰綻張漲帳賬脹趙蟄轍鍺這貞針偵診鎮陣掙睜猙幀鄭證織職執紙摯擲幟質鍾終種腫衆謅軸皺晝驟豬諸誅燭矚囑貯鑄築駐專磚轉賺樁莊裝妝壯狀錐贅墜綴諄濁茲資漬蹤綜總縱鄒詛組鑽緻鐘麼為隻兇準啟闆裡靂餘鍊洩’;
}
function Traditionalized(cc){
 var str=”,ss=JTPYStr(),tt=FTPYStr();
 for(var i=0;i {
  if(cc.charCodeAt(i)>10000&&ss.indexOf(cc.charAt(i))!=-1)str+=tt.charAt(ss.indexOf(cc.charAt(i)));
    else str+=cc.charAt(i);
 }
 return str;
}
function Simplized(cc){
 var str=”,ss=JTPYStr(),tt=FTPYStr();
 for(var i=0;i {
  if(cc.charCodeAt(i)>10000&&tt.indexOf(cc.charAt(i))!=-1)str+=ss.charAt(tt.indexOf(cc.charAt(i)));
    else str+=cc.charAt(i);
 }
 return str;
}

function setCookie(name, value)  //cookies设置
{
 var argv = setCookie.arguments;
 var argc = setCookie.arguments.length;
 var expires = (argc > 2) argv[2] : null;
 if(expires!=null)
 {
  var LargeExpDate = new Date ();
  LargeExpDate.setTime(LargeExpDate.getTime() + (expires*1000*3600*24));
 }
 document.cookie = name + “=” + escape (value)+((expires == null) “” : (“; expires=” +LargeExpDate.toGMTString()))+”;path=”+escape(“/”)+”;domain=”+escape(“tvsou.com”);
}

function getCookie(Name)   //cookies读取
{
 

 var search = Name + “=”
 if(document.cookie.length > 0)
 {
  offset = document.cookie.indexOf(search)
  if(offset != -1)
  {
   offset += search.length
   end = document.cookie.indexOf(“;”, offset)
   if(end == -1) end = document.cookie.length
   return unescape(document.cookie.substring(offset, end))
   }
 else return “”
   }
}

 var JF_cn=”ft”
 var BodyIsFt=getCookie(JF_cn)
 if(BodyIsFt==””)
 {
  //setCookie(“ft”,”1″,7)
  //BodyIsFt=”1″ 
 }
 else
 {
  if(BodyIsFt!=Default_isFT){setTimeout(“StranBody()”,StranIt_Delay)}
 }

///加载页头
r_2_2_2.innerHTML=”
使用Javascript直接将网页进行简繁转换 转

然后在网页的适当位置添加简繁转换链接:繁体中文 简体中文
保存页面后,点击“繁体中文”链接,页面就会成繁体,点击“简体中文”就会自动转换为简体形式,方便不同用户的选择浏览了。
提示:这种方法不仅适用于静态网站还可以用在论坛、留言板等动态网站系统中。

为防止上述网站断开相关链接,这里附上transform.js的内容:

网站繁简转换还有更多方法,如果专业性的网站或转换精度要求更高的网站,上述转换显得有些粗糙。下面是繁简转换的难点:(下文收集自网络:http://www.fjt2.net/gate/gb/www.rnb.com.hk/is/difficult.htm)

 

使用Javascript直接将网页进行简繁转换 转


繁简转换的难点
繁简互转,如果需要做到 100% 精确,实际上是一个非常复杂的工作。根据转换的精确性等级,大概可以分成 4 个等级:

1. 字符码表一对一映射。
2. 对于一对多单字,根据词语识别进行转换。
3. 对词语表达方式差异的转换。
4. 根据上下文的词汇翻译。
 

使用Javascript直接将网页进行简繁转换 转

转换等级一
内码映射
其转换机制是按照内码字符映射表,在繁简转换时,用 BIG5 的内码把 GB 的内码替换掉,在繁简转换的时候就反过来。例如,GB 2312-80 0xB9FA 代表简体字国, 繁简转换的时候就把它替换成 0xB0EA 对应繁体 BIG5 码的国字。根据我们实践证明,如果按照字符的转错几率来统计,对一般性质的文本,该处理方式可以达到 98% 的准确率。但其弱点是由于简繁字体并非一对一的关系,因此忽略掉一些其他较不常用的字。 以下是一个一对一字符内码映射表的例子:
 

繁体目标

BIG

简体源

内码 GB (EUC)

其他可能性

A558

B3F6

B56F

B7A2

A47A

B8C9

乾 干 干

B774

B0B5

B8CC

C0EF

里 里

BC78

D5F7

AAF9

C3C5

 

B4F6

CCC0

 

使用Javascript直接将网页进行简繁转换 转


转换等级二
一对多关系的字根据词语识别转换
对于一个单字应该翻译成在当前有可能的异种内码中的哪 里一个,我们可以根据该字所在的词汇来决定。比如下表:
 

繁体词语

简体词语

拼音

英文

头发

头发

tou2fa0

hair

特征

特征

te4zheng1

characteristic

出发

出发

chu1fa1

start off

干燥

干燥

gan1zao4

dry

暗里

暗里

an4li3

secretly

千里

千里

qian1li3

long distance

秋千

秋千

qiu1qian1

a swing

在上表中,头发与出发的“发”字在简体中是同一字型的,但繁体中却不一样。这样就可以根据“发”字所在的词汇来对该字进行准确的转换。如果是头发就翻译成“头发”,如果是出发就翻译成“出发”。
 

使用Javascript直接将网页进行简繁转换 转

转换等级三
繁简词汇表达方式不同之转换
有一些词,在繁体与简体用户有不同的表达方式,下表显示了一些词汇表达方式差异的例子:
 

英文

繁体表达
方式

汉语拼音

简体表达
方式

汉语拼音

bit

位元

wei4yuan2

wei4

byte

位元组

wei4yuan2zu3

字节

zi4jie2

CD-ROM

光碟

guang1die2

光盘

guang1pan2

computer

电脑

dian4nao3

计算机

ji4suan4ji1

database

资料库

zi1liao4ku4

数据库

shu4ju4ku4

file

档案

dang4’an4

文件

wen2jian4

information

资讯

zi1xun4

信息

xin1xi4

Internet

网际网络

wang3ji4-wang3lu4

因特网

yin1te4wang3

software

软件

ruan3ti3

软件

ruan3jian4

week

礼拜

li3bai4

星期

xing1qi1

能够实现以上表达方式转换,就是在本文中所提到的第三级转换功能。
 

使用Javascript直接将网页进行简繁转换 转

转换等级四
根据上下文对词汇翻译
有一些词,是需要根据上下文才能够准确地决定如何翻译的。比如在中国大陆的语言习惯中,“文件”可以是通常意义上的“文件”,也可以表达电脑磁片中存取的“文件”(document)。但是,在繁体用户的语言习惯中,这两个东西就是分别用两个词来表达,通常意义上的“文件”和在电脑磁片中保存的“档案”。
该层次的翻译需要根据上下文的意思对文章进行断句,分析。因此,是属于繁简互译中最难做的,而且消耗的系统资源也最大。

           

来源:何必当初女

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2019年3月20日
下一篇 2019年3月20日

相关推荐