高质量文化数据集,用于AI大模型训练、学术研究或商业应用
包含从先秦到清末的经典诗词作品,经过专业标注和清洗,适合NLP模型训练。
收录历代名家画作高清数字图像,包含详细元数据标注,适合计算机视觉研究。
收集整理各地区民间传说、神话故事,包含多语言版本,适合文化研究和NLP应用。
收录京剧、昆曲等传统戏曲经典唱段高清音频,包含唱词文本和音乐分析数据。
多家博物馆合作提供的馆藏文物高清图像和详细资料,适合文化遗产数字化研究。
收录全国主要方言区的语音数据,包含文本转写和语言学标注,适合语音识别研究。