您现在的位置：首页> 研究主题> 数据集

数据集

数据集的相关文献在1985年到2023年内共计3410篇，主要集中在自动化技术、计算机技术、大气科学（气象学）、无线电电子学、电信技术等领域，其中期刊论文1171篇、会议论文89篇、专利文献601719篇；相关期刊676种，包括应用气象学报、中国地质、中国数字医学等；相关会议71种，包括第八届中国卫星导航学术年会、第四届高分辨率对地观测学术年会、第32届中国数据库学术会议等；数据集的相关文献由8361位作者贡献，包括杨帆、王勇、张鹏等。

数据集—发文量

期刊论文>

论文：1171篇占比：0.19%

会议论文>

论文：89篇占比：0.01%

专利文献>

论文：601719篇占比：99.79%

总计：602979篇

数据集—发文趋势图

数据集
-研究学者

杨帆
王勇
张鹏
T·比洛
张耀南
李伟
王鹏
J·威斯
刘军
刘娜
吴超
周力
徐波
杨阳
王浩
王磊
伍家松
凌子昊
刘丽华
孔佑勇
孟群
安雪晖
张伟
张发恩
张磊
张翔
张莹
李阳
李鹏飞
杨乐
杨淳沨
王凯
王平
王斌
王琳
甘忠
石望兴
舒华忠
薛超
许卓明
陈超
颜雪松
骆清铭
高林毅
龚辉
R·维姆科
任海萍
刘凯
南一冰
周亮

数据集
-相关主题

数据集
-相关期刊

数据集
-相关会议

期刊论文
会议论文
专利文献

搜索

排序：

专利类型

专利分类

学科

年份

2023
(6)
2022
(675)
2021
(515)
2020
(92)
2019
(86)
2018
(100)
2017
(45)
2016
(52)
2015
(47)
2014
(38)
2013
(50)
2012
(56)
2011
(36)
2010
(38)
2009
(39)
2008
(48)
2007
(41)
2006
(45)
2005
(51)
2004
(34)
2003
(31)
2002
(12)
2001
(10)
2000
(1)
1999
(13)
1998
(11)
1997
(5)
1996
(4)
1995
(5)
1994
(3)
1993
(4)
1992
(2)
1991
(4)
1990
(5)
1989
(4)
1988
(1)
1987
(1)
1986
(2)
1985
(1)

期刊

收录数据库

作者

杨帆
(12)
王勇
(11)
张鹏
(9)
T·比洛
(8)
张耀南
(8)
李伟
(8)
王鹏
(8)
J·威斯
(7)
刘军
(7)
刘娜
(7)
吴超
(7)
周力
(7)
徐波
(7)
杨阳
(7)
王浩
(7)
王磊
(7)
伍家松
(6)
凌子昊
(6)
刘丽华
(6)
孔佑勇
(6)
孟群
(6)
安雪晖
(6)
张伟
(6)
张发恩
(6)
张磊
(6)
张翔
(6)
张莹
(6)
李阳
(6)
李鹏飞
(6)
杨乐
(6)
杨淳沨
(6)
王凯
(6)
王平
(6)
王斌
(6)
王琳
(6)
甘忠
(6)
石望兴
(6)
舒华忠
(6)
薛超
(6)
许卓明
(6)
陈超
(6)
颜雪松
(6)
骆清铭
(6)
高林毅
(6)
龚辉
(6)
R·维姆科
(5)
任海萍
(5)
刘凯
(5)
南一冰
(5)
周亮
(5)

关键词

申请/权力人

;

1. 《中国科技术语》开展科学数据出版
- 摘要：为顺应大数据时代的发展,《中国科技术语》开展科学数据出版服务,以期为作者和读者提供集文献和数据于一体的信息化服务。本刊的数据出版分为2种模式:(1)科技论文附加数据:本刊鼓励作者在提交科技论文时,附加支撑数据集,在文中对相关的科学数据进行描述和管理,为使用者在访问论文的同时,提供科学数据的阅读、引用、分析等。
2. 河北省农业害虫图像识别系统建设
- 刘震；纪明妹；郭志顶；黄素芳；赵忠祥；闫旭东；滕霄；石秘；岳明强；刘青松；徐玉鹏
- 摘要：基于农业技术与信息化技术的不断发展与融合,针对当前河北省农作物害虫识别准确率和效率低等问题,提出了一种基于Asp.NET Core MVC架构的残差神经网络害虫图像识别系统。该系统首先通过移动采集终端和网络图片爬虫收集目标分类图片信息,再使用数据增强技术扩充样本库,得到神经网络训练模型的数据集;然后通过搭建机器学习框架,分别引入ResNet-50、ResNet-101、ResNet-152残差网络模型,对数据集执行训练并验证其准确度;最后将准确度最高的训练结果模型运用至农作物害虫分类服务系统。经验证,该识别模型具有良好的适用性和鲁棒性,可为河北省主要农作物虫害提供识别及诊断功能。
- 农业
- 害虫
- 图像识别
- 数据集
- 模型
3. 医疗健康知识挖掘中的语义资源、数据集和工具
- 张伟；张展鹏；张明淘；韩普
- 摘要：医疗健康知识挖掘在人工智能和大数据时代受到了学界的极大关注,目前已经成为信息抽取和文本挖掘中的重要研究方向。在基于深度学习的实体识别、实体关系抽取、问答系统以及知识图谱构建研究中,各类语义资源、数据集和工具已经成为开展医疗健康知识挖掘的重要保障。该文首先对医疗健康知识挖掘中需要使用的UMLS、MeSH和SNOMED CT等语义资源进行了系统梳理,并详细分析了各类语义资源的实际应用场景,指出了中文语义资源存在的问题和不足;其次对英文和中文的电子病历、医学文献和在线健康数据集进行了重点论述,并对数据集的应用任务进行了分析;最后论述了常见的医疗健康文本处理工具和系统,并就其具体应用进行了讨论。该文为国内更好地开展医疗健康知识挖掘提供了参考。
4. 基于机器学习的传感云入侵检测方法
- 王铁胜
- 摘要：针对传感云网络易受到入侵攻击的问题,提出基于机器学习的传感云入侵检测方法.首先,计算传感云入侵响应指标;其次,建立双向卷积神经入侵检测模型,在此模型中,设计机器学习的C4.5映射算法;最后,通过混合串行入侵防护实现传感云入侵检测.实验结果表明:设计方法所得出的虚警概率相对较低,说明检测过程中出现的误差较少,效果更佳,具有实际应用意义.
5. 基于改进YOLOv3的复杂环境下交通标志检测
- 马露茜；吴钦木
- 摘要：针对深度学习算法中目标检测网络模型在复杂环境下识别交通标志的难点,对YOLOv3模型迁移学习算法的基本特点展开研究,构建并划分了复杂环境下中国交通标志数据集,并通过引入特征尺度的概念进一步改进YOLOv3算法,使数据集能够更好地处理各种复杂环境带来的影响。通过对比实验,证明改进后的YOLOv3算法对复杂环境下交通标志检测的效果明显优于标准YOLOv3算法及SSD算法,获得了更高的检测精度和更短的检测时间。
6. 乳腺癌病理图像特征提取方法研究综述
- 石静文；李嘉
- 摘要：乳腺癌是女性最多见和死亡率最高的癌症之一,因此乳腺癌的早期筛查与诊断非常有必要,不仅能及时发现隐患,而且可以有效提高患者的存活率。乳腺癌病理图像的特征提取和分类已经成为医学图像处理研究领域的热点,如何准确、高效地检测乳腺癌也成为重要研究内容之一。按照是否需要人工提取乳腺癌病理图像特征,将乳腺癌病理图像特征提取算法分为两大类,分别是基于纹理、形态特征等的传统人工特征提取方法和基于深层神经网络的自动特征提取方法。介绍了几种乳腺癌病理图像相关数据集,然后总结归纳了近几年乳腺癌病理图像特征提取算法的研究进展,并分析了其优缺点,最后,得出乳腺癌病理图像特征提取研究的结论,并对乳腺癌病理图像特征提取的未来发展趋势进行了展望。
7. 基于典型非机动车事故的自动驾驶汽车测试场景构建方法研究
- 严慈磊；应朝阳；孙巍；范志翔
- 摘要：基于交通事故卷宗、交通事故视频信息数据,研究机非混行交通环境下典型交通事故形态,构建了面向机非混行交通环境下的自动驾驶汽车测试场景,旨在针对我国较为特殊的机非混行环境下的自动驾驶汽车的测试场景及测试评价方法提供参考。本文首先分析了自动驾驶测试场景的构建需求,建立交通事故数据筛选标准,得到133例可用于构建自动驾驶汽车测试场景的机动车与非机动车交通事故数据集;其次基于《中华人民共和国道路交通安全法》行驶要求,对133例交通事故的发生地点、车辆行为、道路类型、环境光线等方面进行解构分析;最后通过聚类分析,建立了5类典型的自动驾驶测试场景模型,并分析了不同场景模型的关键要素,为实际道路测试提供理论指导。
8. 基于深度学习的MRI诊断半月板损伤的研究进展
- 胡伟艺；苏娴彦；柯晓婷；陈焱锋；赖清泉
- 摘要：半月板撕裂是膝关节损伤的常见类型,若治疗不当,易引发膝关节疼痛、骨性关节炎等一系列临床症状。正确识别半月板病变是进行患者教育和临床干预的重要前提。MRI是临床诊断半月板损伤的最常用影像学方式,其能够准确反映半月板撕裂的位置、撕裂类型、半月板形态等,是临床诊断半月板撕裂的首选影像学方式。基于深度学习的MRI疾病检测是人工智能的一个新兴领域,随着深度学习算法的临床效用研究不断推进,人工智能可能最终转化为临床实践。本文从迁移学习与定制的神经网络两大分类中探究半月板损伤二分类、撕裂位置、撕裂方向、分级和感兴趣区分割等方面的基于深度学习的半月板MRI诊断研究进展,并指出当前研究的一些不足,以期为后续研究提供参考思路。
9. 预训练文本摘要研究综述
- 张紫芸；王文发；马乐荣；丁苍峰
- 摘要：大数据时代,如何缓减信息过载问题,是人工智能领域研究的热点和难点之一。其中,文本“降维”的摘要生成便是其中一个重要的方法,旨在将文本或文本集合转换为包含关键信息的简短摘要。近年来预训练语言模型提高了许多自然语言处理任务的性能,包括文本摘要、情感分析、问答、自然语言推理、命名实体识别和文本相似性等。梳理近几年基于预训练的文本摘要方法,并对文本摘要的数据集以及评价方法进行了整理,最后讨论了文本摘要面临的挑战与发展趋势。
10. 国防领域航空颠覆性技术识别
- 陈龙；宋庆国；廖孟豪
- 摘要：以百年未有之大变局下的大国博弈为切入点,立足未来航空科技发展的军事应用需要界定国防领域航空颠覆性技术的概念内涵,遴选适合国防领域航空颠覆性技术的识别方法,并以航空领域特定时段公开发表且被工程索引收录的高质量期刊/会议论文、高水平科学引文索引期刊论文及已获授权的三方发明专利为源数据构建颠覆性技术识别的数据集,通过文本聚类、复杂网络方法和军事应用潜力评估完成一批国防领域航空颠覆性技术识别,为开展军事航空颠覆性技术研发部署提供参考。

1. 向和从云网络中存储和取回受限制的数据集和非受限制的数据集
- 国际商业机器公司
- 公开公告日期：2021.09.10
- 摘要：提供了用于向或从云网络存储和取回受限制的数据集和非受限制的数据集的技术。接收将数据集从一个或多个存储设备转储到所述云存储器的请求，其中所述数据集包括受限制的数据集和非受限制的数据集，并且其中所述受限制的数据集采用云存储器不支持的格式。识别所述受限制的数据集。所述受限制的数据集将转换为云存储器支持的格式，以生成转换后的数据集。所述转换后的数据集和所述非受限制的数据集将转储到所述云存储器中的一个容器中。
2. 用于组合数字数据集的方法和编码器、用于这种组合式数字数据集的解码方法和解码器以及用于存储这种组合式数字数据集的记录载体
- 银河工作室股份有限公司
- 吉多·范登·贝格
- 维尔弗里德·万·巴埃伦
- 公开公告日期：2010-02-03
- 摘要：本发明涉及用于组合数字数据集的方法和编码器、用于这种组合式数字数据集的解码方法和解码器以及用于存储这种组合式数字数据集的记录载体。其中，通过将第一样本子集等化成与第一样本子集交错的来自第二子集的相邻样本并且通过随后将来自两个数字数据集的相应样本相加而组合两个数字数据集，其中该两个数字数据集的等化样本并不时间对应。这产生了允许分离该两个数字数据集的第三数字数据集。当将两个数字音频流组合成单一数字音频流时，该第三数字数据集仍然是该两个组合数字音频流的良好的单音表示并且因此能够被在普通再现装备上再现，然后使用根据本发明的解码器允许将该两个数字数据集从该第三数字数据集分离。
3. 用于根据生物特征数据将医学图像数据集与医学比较图像数据集相关联的方法
- 西门子医疗有限公司
- 公开公告日期：2022-12-13
- 摘要：本发明涉及一种用于根据生物特征数据将医学图像数据集与医学比较图像数据集相关联的计算机实现的方法。所述方法包括接收(REC‑1)医学图像数据集的方法步骤。所述方法还包括接收(REC‑2)至少一个医学比较图像数据集的方法步骤。所述方法还包括基于医学图像数据集提取(EXT‑1)生物特征数据的方法步骤。所述方法还包括基于医学比较图像数据集提取(EXT‑2)生物特征比较数据的方法步骤。所述方法还包括确定(DET‑1)在生物特征比较数据和生物特征数据之间的偏差量的方法步骤。所述方法还包括以下方法步骤：当偏差量低于阈值时，将医学图像数据集与医学比较图像数据集相关联(CON)。
4. 处理具有编码数据集和原始数据集的数据流的装置及方法
- 奇景光电股份有限公司
- 公开公告日期：2009-10-07
- 摘要：一种处理具有编码数据集和原始数据集的数据流的装置及方法，该数据流为一阶层式图层架构，该装置包含有：一第一处理电路，用来在检测到该数据流中对应一预设图层的一数据集时产生一启动信号，而该启动信号对应于该阶层式图层架构中的该预设图层；以及一第二处理电路，耦接于该第一处理电路，用来在接收到来自该第一处理电路的该启动信号后辨别该数据集的一辨识码是否对应于一预设的原始数据集辨识码。
5. 一种金属带材板形缺陷图像数据集的制作方法及数据集
- 燕山大学
- 公开公告日期：2022-06-14
- 摘要：本发明提供了一种金属带材板形缺陷图像数据集的制作方法及数据集，涉及带材板形质量检测技术领域。首先根据生产需求，科学系统的划分了金属带材常见板形缺陷的类别；其次在生产现场采集了大量带材板形缺陷的原始图像，根据图像处理理论，针对板形缺陷原始图像设计了系统性的缺陷图像处理流程及方法，通过该方法对板形缺陷原始图像中的无效信息区域进行自动化掩码处理，保留有效信息区域；最终制作了金属带材板形缺陷图像数据集。本发明对板形缺陷图像的处理精度高，执行速度快，制作的数据集中包含的板形缺陷类别多，符合真实生产情况，对基于机器视觉的板形缺陷检测研究具有重要意义。
6. 学习用数据集生成装置以及学习用数据集生成方法
- 发那科株式会社
- 公开公告日期：2022-09-23
- 摘要：一种学习用数据集生成装置(1)，具备：存储器，其存储工件(W)及容器(X)的三维CAD数据；以及一个以上的处理器，其包含硬件，处理器使用存储于存储器中的工件(W)以及容器(X)的三维CAD数据，在虚拟三维空间内生成在容器(X)内以不同的形态随机堆叠有多个工件(W)的多个被摄体，利用配置于虚拟三维空间内的虚拟三维测量机测量所生成的各被摄体，获取多个虚拟距离图像，针对获取到的各虚拟距离图像接收至少一个示教位置，将接收到的示教位置与各虚拟距离图像相关联，从而生成学习用数据集。
7. 用于将添加到第一超声成像模式数据集的标记转置到第二超声成像模式数据集的方法和系统
- 通用电气精准医疗有限责任公司
- 公开公告日期：2022-08-30
- 摘要：本发明提供了一种用于将添加到第一超声成像模式数据集的标记转置到第二超声成像模式数据集的系统和方法。该方法包括根据第一模式采集第一超声图像数据集。该方法包括根据第一模式处理第一超声图像数据集以生成第一模式图像。该方法包括使显示系统呈现第一模式图像。该方法包括响应于用户输入而向第一模式图像添加至少一个标记。该方法包括接收切换到第二模式的选择。该方法包括使显示系统呈现具有添加到第一模式图像的至少一个标记的第二模式图像。
8. 围术期患者样本数据集均衡方法及样本数据集获取系统
- 四川大学
- 公开公告日期：2022-10-18
- 摘要：本发明提供了一种围术期患者样本数据集均衡方法及样本数据集获取系统。样本数据集均衡方法包括：S1，对围术期患者的样本数据集中的少数类标签样本进行过采样获得合成样本，为合成样本生成对应的合成标签集，样本数据集包括多个样本和样本对应分类标签集；S2，将合成样本和合成标签集加入样本数据集获得临时样本数据集；S3，对临时样本数据集中的样本进行清洗获得均衡样本数据集。对样本数据集中的少数类标签样本进行过采样以增加少数类标签样本数量，均衡多数类标签样本和少数类标签样本，清洗噪声样本提升输出的均衡样本数据集中样本质量，均衡样本数据集用于后续分类处理时能够提升分类模型的表现效果。
9. 用神经网络处理多样数据集以生成用于预测目标度量的合成数据集的系统和方法
- 纳斯达克公司
- 公开公告日期：2021-10-26
- 摘要：一种计算机系统包括一个或多个用户输入适配器，其被配置为接收输入数据集、目标度量和指示要生成的合成数据集的期望数量的参数。存储器存储指令和数据，所述数据包括输入数据集、目标度量、指示合成数据集的期望数量的参数、以及神经网络。神经网络包括求和节点和多个处理节点。
10. 确定用于数据集和用于迁移数据集的最优存储环境
- 国际商业机器公司
- 公开公告日期：2021-02-12
- 摘要：本公开涉及确定用于数据集和用于迁移数据集的最优存储环境。提供了一种用于确定数据集和用于迁移数据集的最优存储环境的计算机程序产品、系统和方法。每个应用的元数据指示由应用用来存储数据集的存储池，其中每个存储池被配置在使用不同组织方案来存储数据集的多个存储环境之一中。至少一个应用的元数据指示从不同存储环境分配的用来存储应用的数据集的存储池。处理应用的元数据以确定存储在第一存储环境中实现的第一存储池中的应用的数据集，该数据集应当存储在第二存储环境中。将所确定的数据集从第一存储池传送到在第二存储环境中实现的第二存储池。

数据集

数据集—发文量

数据集—发文趋势图

数据集-研究学者

数据集-相关主题

数据集-相关期刊

数据集-相关会议

数据集
-研究学者

数据集
-相关主题

数据集
-相关期刊

数据集
-相关会议