“中文+职业”背景下的跨境电商职业中文核心词表构建
"中文+X"已成为国际中文教育发展的新趋势,未来将需要更多高水平复合型的中文人才。跨境电商蕴含着显著的二维动态演进特征,随着我国构建"新发展格局"战略的深入推进,在"中文+职业"不断发展的情况下,未来对"中文+跨境电商"人才需求量将会逐渐增加。本文基于自建原始语料约1586万4067字符的语料库,构建了跨境电商职业中文核心词表。在构建过程中,利用Python编程对语料进行爬取、降噪、语料聚类等操作,通过编程代码调动Pkuseg作为汉语分词工具,并围绕词语的高频性、跨子库分布、Juilland’s D值和专业性作为选词维度,同时融入了人工筛选与复核环节。最终研制了具有跨境电商特色的"中文+跨境电商"词表。