论文筛选

-

领域

  • 23篇自动化与计算...
  • 21篇文化科学
  • 8篇经济管理
  • 3篇社会学
  • 2篇医药卫生
  • 1篇电气工程
  • 1篇自然科学总论

主题

  • 48篇数据清洗
  • 11篇数据质量
  • 6篇数据仓库
  • 4篇数据转换
  • 4篇大数据
  • 3篇数据集成
  • 3篇数据挖掘
  • 3篇数据准备
  • 3篇图书馆
  • 3篇相似重复记录
  • 2篇异常数据检测
  • 2篇正则表达式
  • 2篇知识服务
  • 2篇数据采集
  • 2篇数据挖掘过程
  • 2篇重复记录检测
  • 2篇专利信息
  • 2篇ETL
  • 1篇异常点检测
  • 1篇异构数据库

机构

  • 2篇南京大学
  • 2篇南京理工大学
  • 2篇北京工业大学
  • 2篇山东大学
  • 2篇中国科学技术...
  • 2篇中国科学院国...
  • 1篇复旦大学
  • 1篇北京师范大学
  • 1篇华中科技大学
  • 1篇华东理工大学
  • 1篇江南大学
  • 1篇安徽建筑工业...
  • 1篇宝钢集团有限...
  • 1篇四川大学
  • 1篇武汉大学
  • 1篇中山大学
  • 1篇上海工程技术...
  • 1篇中南大学
  • 1篇南京审计学院
  • 1篇陕西教育学院

作者

  • 2篇翟东升
  • 2篇刘喜文
  • 1篇赵京
  • 1篇李广建
  • 1篇赵蕴华
  • 1篇邱均平
  • 1篇温素彬
  • 1篇黄鲁成
  • 1篇黄永文
  • 1篇章成志
  • 1篇董克
  • 1篇王曰芬
  • 1篇范体军
  • 1篇李凡
  • 1篇李英
  • 1篇张旭
  • 1篇张娣
  • 1篇陈春颖
  • 1篇薛跃
  • 1篇张金城

期刊

  • 7篇现代图书情报...
  • 4篇图书与情报
  • 4篇科技资讯
  • 3篇现代情报
  • 3篇情报杂志
  • 2篇情报理论与实...
  • 2篇科技创新与应...
  • 1篇调研世界
  • 1篇审计与经济研...
  • 1篇图书馆建设
  • 1篇数量经济技术...
  • 1篇中国图书馆学...
  • 1篇图书情报知识
  • 1篇求索
  • 1篇中国卫生事业...
  • 1篇高校图书馆工...
  • 1篇农业图书情报...
  • 1篇管理工程学报
  • 1篇陕西教育学院...
  • 1篇湖北工学院学...

年份

  • 2篇2019
  • 7篇2018
  • 5篇2017
  • 5篇2016
  • 3篇2015
  • 4篇2014
  • 4篇2013
  • 3篇2012
  • 1篇2011
  • 4篇2010
  • 3篇2009
  • 1篇2008
  • 3篇2007
  • 2篇2006
  • 1篇2005
  • 1篇2003
  • 1篇2002
检索条件:
"关键词=数据清洗"
50 条 记 录,以下是 1-10
基于Excel的数据清洗应用研究获取全文在线阅读
1
出  处:《科技资讯》 2019年第15期28-28,30共2页
作  者:滕文惠 闫媛媛 姚晓芳
摘  要:高质量的数据数据分析和应用的重要保证,“脏数据”会导致不可靠输出,这种输出导致的结果有可能难以弥补,因此数据清洗尤为重要。该文重点阐述了数据清洗思路及利用Excel软件进行数据清洗的具体方法,为教育和科研工作者提供一些...
关 键 词:Excel 数据清洗 方法 
下载次数:0   在线阅读:3
基于Word2Vec的SCI地址字段数据清洗方法研究获取全文在线阅读
2
出  处:《情报杂志》 中国人文科学核心期刊要览 2019年第2期195-200,共6页
作  者:孙源
摘  要:[目的/意义]旨在设计一种有效针对SCI地址字段的数据清洗方案,将Word2Vec词向量模型引入到SCI地址字段的清洗过程中,利用地址字段中上下文的信息,识别SCI地址字段中机构名称的不同写法,最终建立“机构名称映射表”...
关 键 词:数据清洗 Word2Vec 词向量模型 SCI地址字段 
下载次数:0   在线阅读:28
基于数据清洗“DEAN”流程的健康信息领域研究热点探测获取全文在线阅读
3
出  处:《现代情报》 2018年第10期73-77,共5页
作  者:潘玮 郑鹏 黄锦泉 牟冬梅 李茵
基金项目:国家自然科学基金项目“嵌入式知识服务驱动下的领域多维知识库构建”(项目编号:71573102);安徽省教育厅人文社会科学研究项目“‘互联网+’环境下面向‘大健康’的医学信息管理专业人才培养影响因素及对策研究”(项目编号:SK2018A0173)。
摘  要:[目的/意义]了解我国健康信息领域研究热点,提升研究热点识别的准确性。[方法/过程]论文首先构建了数据清洗“DEAN”流程,在此基础上以CNKI和万方数据库收录的2004-2017年健康信息领域文献数据为研究对象,运用C...
关 键 词:数据清洗 DEAN 健康信息 研究热点 
下载次数:0   在线阅读:2
数据清洗在统计调查实践中的应用获取全文在线阅读
4
出  处:《调研世界》 2018年第10期57-59,共3页
作  者:马克
摘  要:高质量的数据是进行各种分析的基本条件,而数据采集、数据整理、数据存储以及数据分析过程中,数据清洗是一个重要环节,是保证数据质量的有效手段。本文重点探讨统计调查实践中数据清洗对象、数据清洗的基本思路和流程,针对实际工作中出...
关 键 词:数据质量 数据清洗 社情民意统计调查 
下载次数:0   在线阅读:25
机器学习项目中使用统计学方法的十个例子获取全文在线阅读
5
出  处:《数据分析与知识发现》 中国人文科学核心期刊要览 2018年第7期80-80,共1页
摘  要:统计学和机器学习是两个联系紧密的领域。事实上,两者的界限有时非常模糊。有一些明显属于统计学领域的方法也可用于机器学习项目,并且极具价值。(1)问题架构。统计方法在问题的架构阶段有助于探索数据,包括:探索性的数据分析;数据...
关 键 词:统计学方法 机器学习 个例 统计方法 数据清洗 统计学模型 数据可视化 异常点检测 
下载次数:1   在线阅读:21
基于LightGBM算法的P2P项目信用评级模型的设计及应用获取全文在线阅读
6
出  处:《数量经济技术经济研究》 2018年第5期144-160,共17页
作  者:马晓君 沙靖岚 牛雪琪
基金项目:本文获得国家社科基金项目“高维数据下企业信用评级方法的改进与应用研究”(17BTJ020)、国家自然科学基金项目(71772113)、2017年度辽宁省哲学社会科学规划基金项目(L17BTJ003)的资助。
摘  要:研究目标:在大数据和互联网金融发展的背景下,依据个人信用,有效控制P2P项目的违约率以保证相关金融项目或平台的良好运营。研究方法:本文基于美国P2P平台Lending Club的海量真实交易数据,采用“多观测”与“多维度...
关 键 词:P2P 信用评级 违约率控制 数据清洗 LightGBM算法 
下载次数:14   在线阅读:135
数据智慧:开启智慧海关建设的关键密匙获取全文在线阅读
7
出  处:《海关与经贸研究》 2018年第2期44-56,共13页
作  者:崔建高
摘  要:2016年我国正式实施“大数据战略”,2017年5月4日,国务院《政务信息系统整合共享实施方案》出台。在这一背景下,加快做好全国海关大数据应用工作,提升数据科学处置能力已是当务之急。2017年全国海关关长会议明确提出:“...
关 键 词:智慧海关 数据治理 数据挖掘 数据清洗 数据 
下载次数:2   在线阅读:22
基于模型检测方法的中文专利法律状态数据清洗研究获取全文在线阅读
8
出  处:《情报理论与实践》 2018年第3期49-56,共8页
作  者:吴鹏 张叙 路霞
基金项目:国家自然科学基金项目“突发事件网民负面情感的模型检测研究”(项目编号:71774084);国家自然科学基金项目“突发事件网络舆情演变过程中的人群仿真研究”(项目编号:71273132);国家自然科学基金项目“基于时间感知模型的学术主题检索与演化挖掘研究”(项目编号:71503124); 江苏省“青蓝工程2016(15)”资助的研究成果
摘  要:[目的/意义]专利法律状态信息具有时序特征,其清洗工作要求保证法律状态个体的正确性和状态之间时序关系的合理性,文章设计了一个时序关系数据清洗框架,识别出专利法律状态数据中所隐藏的时序逻辑问题。[方法/过程]利用模型检测方...
关 键 词:模型检测方法 专利 数据清洗 数据质量 
下载次数:0   在线阅读:19
基于时间序列分析的电力负荷数据预处理方法获取全文在线阅读
9
出  处:《科技创新与应用》 2018年第7期94-95,共2页
作  者:王在乾 向敏 高盼
摘  要:智能电网中的电力负荷数据因来源于不同的信息采集系统,电力负荷数据维度和格式可能不一致,导致的电力负荷数据可信度差,可利用度低,难以实现电力负荷数据深度挖掘。针对缺失值、噪声值等异常的清洗问题,提出一种基于时间序列的能够统...
关 键 词:时间序列分析 负荷预处理 智能电网 数据清洗 数据挖掘 
下载次数:0   在线阅读:20
高校图书馆数据清洗问题与策略研究获取全文在线阅读
10
出  处:《高校图书馆工作》 中国人文科学核心期刊要览 2017年第6期35-40,共6页
作  者:樊慧丽 邵波
摘  要:随着高校图书馆数据应用需求的增长,数据质量问题和数据清洗的重要性日益凸显。文章总结了数据清洗的发展趋势及其主要方法,分析并梳理高校图书馆数据清洗中的问题,并在此基础上从数据清洗系统、图书馆和数据使用者三方利益相关者的角度...
关 键 词:高校图书馆 数据清洗 数据管理 数据挖掘 数据分析 
下载次数:1   在线阅读:22
聚类工具0
11
分类表关闭X
隐藏
比较