数据科学研究的现状与趋势

被引:82
作者
朝乐门 [1 ,2 ]
邢春晓 [3 ,4 ,5 ]
张勇 [3 ,4 ,5 ]
机构
[1] 数据工程与知识工程教育部重点实验室(中国人民大学)
[2] 中国人民大学信息资源管理学院
[3] 清华大学计算机科学与技术系
[4] 清华大学信息技术研究院
[5] 清华信息科学与技术国家实验室(筹)
关键词
数据科学; 大数据; 数据产品开发; 数据加工; 数据驱动;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
大数据时代的到来催生了一门新的学科——数据科学。首先,探讨了数据科学的内涵、发展简史、学科地位及知识体系等基本问题,并提出了专业数据科学与专业中的数据科学之间的区别与联系。其次,分析现阶段数据科学的研究特点,并分别提出了专业数据科学、专业中的数据科学及大数据生态系统中的相对热门话题。接着,探讨了数据科学研究中的10个争议及挑战:思维模式的转变(知识范式还是数据范式)、对数据的认识(主动属性还是被动属性)、对智能的认识(更好的算法还是更多的数据)、主要瓶颈(数据密集型还是计算密集型)、数据准备(数据预处理还是数据加工)、服务质量(精准度还是用户体验)、数据分析(解释性分析还是预测性分析)、算法评价(复杂度还是扩展性)、研究范式(第三范式还是第四范式)、人才培养(数据工程师还是数据科学家)。然后,提出了数据科学研究的10个发展趋势:预测模型及相关分析的重视,模型集成及元分析的兴起,数据在先、模式在后或无模式的出现,数据一致性及现实主义的回归,多副本技术及靠近数据原则的广泛应用,多样化技术及一体化应用并存,简单计算及实用主义占据主导地位,数据产品开发及数据科学的嵌入式应用,专家余及公众数据科学的兴起,数据科学家与人才培养的探讨。最后,结合文中工作,对数据科学研究者给出了几点建议和注意事项。
引用
收藏
页码:1 / 13
页数:13
相关论文
共 27 条
[1]   大数据可用性的研究进展 [J].
李建中 ;
王宏志 ;
高宏 .
软件学报, 2016, 27 (07) :1605-1625
[2]  
Challenges of Big Data analysis[J]. Jianqing Fan,Fang Han,Han Liu.National Science Review. 2014(02)
[3]  
数据科学理论与实践[M]. 清华大学出版社 , 朝乐门, 2017
[4]  
Leading NoSQL models for handling Big Data: a brief review[J] . Sugam Sharma,Ritu Shandilya,Srikanta Patnaik,Ashok Mahapatra.Int. J. of Business Information Systems . 2016 (1)
[5]  
Social big data: Recent achievements and new challenges[J] . Gema Bello-Orgaz,Jason J. Jung,David Camacho.Information Fusion . 2016
[6]  
Rethinking big data: A review on the data quality and usage issues[J] . Jianzheng Liu,Jie Li,Weifeng Li,Jiansheng Wu.ISPRS Journal of Photogrammetry and Remote Sensin . 2015
[7]  
A Data Science Course for Undergraduates: Thinking With Data[J] . Ben Baumer.The American Statistician . 2015 (4)
[8]  
Data Science in Statistics Curricula: Preparing Students to?“Think with Data”[J] . J. Hardin,R. Hoerl,Nicholas J. Horton,D. Nolan,B. Baumer,O. Hall-Holt,P. Murrell,R. Peng,P. Roback,D. Temple Lang,M. D. Ward.The American Statistician . 2015 (4)
[9]  
Efficient Machine Learning for Big Data: A Review[J] . Omar Y. Al-Jarrah,Paul D. Yoo,Sami Muhaidat,George K. Karagiannidis,Kamal Taha.Big Data Research . 2015 (3)
[10]   Let's Make Gender Diversity in Data Science a Priority Right from the Start [J].
Berman, Francine D. ;
Bourne, Philip E. .
PLOS BIOLOGY, 2015, 13 (07)