OMIM (Online Mendelian Inheritance in Man)
OMIM是一个包含人类基因和遗传疾病信息的在线数据库。它提供了详细的遗传疾病描述、基因定位、相关文献和临床信息。数据集内容包括疾病名称、基因名称、基因定位、遗传模式、临床特征、相关文献引用等。
www.omim.org 收录
Yahoo Finance Historical Data
该数据集包含来自Yahoo Finance的历史股票数据,涵盖了股票的开盘价、收盘价、最高价、最低价、成交量等信息。数据集的时间跨度从2000年1月至今,提供了全球多个市场的股票数据。
finance.yahoo.com 收录
MultiTalk
MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。
arXiv 收录
Chinese Calligraphy Image Dataset
本数据集名为‘Chinese Calligraphy Image Dataset’,由同济大学设计人工智能实验室创建,包含138,499张由19位书法家书写的汉字图像,涵盖7328个不同汉字。数据集通过互联网收集,用于训练名为CalligraphyGAN的条件生成对抗网络,以生成具有美学价值的抽象艺术作品。该数据集主要应用于通过AI技术创造独特的餐饮体验,如在餐厅中通过投影展示定制的艺术作品。
arXiv 收录
太湖水质监测数据集(2000-2020年)
“太湖站”数据资料来源主要为长期定位观测数据、特色长期观测和研究数据资源,是一个不断积累完善的过程,自1991年建站以来,连续收集太湖的气象、水体物理和化学指标、水生生物指标等有关湖泊生态系统方面的数据。
该数据集数据源为中国科学院太湖湖泊生态系统研究站监测数据,包含了太湖14个水质监测站点数据,及太湖水总氮、总磷、叶绿素等水体化学要素的季度观测记录数据。
数据内容包含了2个excel表格,“观测站点.xlsx”,为太湖水质观测站点信息;“太湖氮、磷、叶绿素季度数据.xlsx”,为水体化学要素指标观测数据。
国家地球系统科学数据中心 收录