单语语料库在翻译实践中如何应用?
- 教育综合
- 2023-09-08 12:59:42
语料库的用途
语料库的用途如下:
语料库指经科学取样和加工的大规模电子文本库,其中存放的是在语言的实际使用中真实出现过的语言材料。
语料库有多种类型,确定类型的主要依据是它的研究目的和用途,这一点往往能够在语料采集的原则和方式上有所体现。有人曾经把语料库分成四种类型:
⑴异质的(Heterogeneous):没有特定的语料收集原则,广泛收集并原样存储各种语料;
⑵同质的(Homogeneous):只收集同一类内容的语料;
⑶系统的(Systematic):根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围内的语言事实;
⑷专用的(Specialized):只收集用于某一特定用途的语料。
除此之外,按照语料的语种,语料库也可以分成单语的(Monolingual)、双语的(Bilingual)和多语的(Multilingual)。按照语料的采集单位,语料库又可以分为语篇的、语句的、短语的。
双语和多语语料库按照语料的组织形式,还可以分为平行(对齐)语料库和比较语料库,前者的语料构成译文关系,多用于机器翻译、双语词典编撰等应用领域,后者将表述同样内容的不同语言文本收集到一起,多用于语言对比研究。
已经累积了大量各种类型的语料库,如:
葡萄牙语料库、面向文本分类研究的中英文新闻分类语料库、路透社文本分类训练语料库、中文文本分类语料库、大开放字幕库OpenSubtitles的多语言平行语料数据(OpenSubtitles Corpus)、Short messages service(SMS) corpus(短消息服务(SMS)语料)等。
什么是双语平行语料库?它在翻译中起什么作用?管理语料库都用哪些软件
火云译客里有全国最大的语料库,一共估计有5000万条左右,可以在翻译时使用。语料库一般是关于某些行业的术语,在翻译时使用能增加准确率对齐之后的语料有什么作用啊?
语料是指文本的大量集合。经过清洗、对齐等加工处理后的语料是语言研究和应用的珍贵资源。语料库就是存放语料的仓库。 语料库按照语种数量分类可分为单语、双语和多语语料库,运用到翻译领域的语料库被称为翻译记忆库(Translation Memory,简称TM)。 语料库是需要人工进行对齐的,但是有一些工具可以帮助提升对齐效率。一些机器翻译辅助软件如Trados等内嵌win align对齐功能,市面上也有一些纯对齐软件,如Tmxmall Aligner, Abbyy等等。 对齐后的语料可以用于语言学研究、提升翻译效率、或训练机器翻译等用处。在翻译研究中使用基于语料库和语料库驱动的方法有哪些利弊
语料库能够反映商务话语实践的真实状况.随着研究的不断深入,学者们逐渐发现以模拟语料和人工语料为基础的商务翻译教学存在很多弊端,商务实践中的应用性不强.究其原因,模拟语料和人工语料大多由研究者主观推测产生,与现实情况的切合度不高.
商务英语语料库概述:Nelson(2000)建立了102万词次的“商务英语语料库”,收录28类商务文本,是最早的商务英语语料库.其中,书面语料为56%,口语语料为44%.全库语料由“关于商务的”(about business)和“商务实践”(to do business)两类构成.
其中,商务实践类语料大部分来自于各公司的真实商务文件,对于研究真实语境中的商务英语特点具有重要意义.Nelson呼吁以真实语料为对象的商务话语研究,并利用语料库软件将自建的商务英语语料库与英国国家语料库、公开资料语料库进行对比,分析商务英语与日常英语在词汇选择上的异同,发现在礼貌程度、句型及句式等方面二者的差异很大
.Nelson(2000)首次采用语料库的方法揭示商务英语的语言特点和语用特点,在一定程度上显示出商务实践与商务T教学衔接中的问题
基于语料库的研究有利于改善商务翻译人才的培养模式.随着我国经济蓬勃发展,国际影响力不断提升,与各国的商务往来日趋频繁,更加凸显商务翻译人才的需求与重要性.语料库驱动研究有助于改善商务翻译人才的培养模式,提高翻译人才的素质,以便能更快更好地为国家培养与输送商务翻译人才,整体提高我国企业参与国际竞争的“软实力”,为我国在商务实战与研究中争得一席之地.
翻译的同学,能给我详细阐述一下什么是翻译语料库
翻译主要用的是双语语料,即中英或中日这种对照的。 在CAT工具中,像trados或者Yicat这种在线工具中,导入语料库,能够在翻译的时候,通过软件或工具识别出现在翻译的句段和语料库中的匹配程度,匹配程度高的,甚至百分百匹配的可以直接使用或修改后使用。 这样译员在翻译的时候就更得心应手啦。 如果自己积累的话的确很辛苦,需要常年积累制作。有一些平台提供免费的语料库,像tmxmall。他家也有语料商城,可以几块钱买买其他用户制作的。下一篇
返回列表