克罗地亚作为欧盟成员国,在数字政府建设与信息公开方面持续推进。电子邮件是其政府部门、企业和教育机构主要的数字通信手段之一。围绕这些内容构建的“克罗地亚电子邮件数据集”,为南斯拉夫语言分支(尤其是克罗地亚语)自然语言处理研究、行政沟通分析与网络安全提供了丰富的现实语料支持。
克罗地亚邮件列表克罗地亚电子邮件数据集 由于数据隐私法规较严格,目前尚无大规模公开的克罗地亚原始电子邮件数据集,但以下方式为研究人员提供了部分语料支持:
政府电子政务平台:通过信息公开请求(根据《信息自由获取法》)获得部分非敏感通信摘要
高校与科研机构语料项目:萨格勒布大学、里耶卡大学等项目中构建的电子通信模拟数据
新闻与调查报告中的邮件引用:如“Agrokor”丑闻中公开的企业高管邮件片段
合成数据集:模拟政府或企业环境下的克罗地亚语邮件对话,广泛用于NLP训练