20160302笔记

在数据科学中图书馆员永远不会处于中心地位,永远是辅助,做支撑工作。任何科学都有核心领域,或都在行程核心,数据科学必然是统计学、数学、算法、机器学习,当然还会有很多“鸡尾酒”,与其它应用科学的交叉边缘领域,例如生命数据科学、人文数据科学、商业数据科学等,虽然他们有很大的一致性,但也有很大的不同,基本的范式算法都有可能不同。

国外研究图书馆和高校图书馆专门有团队帮助研究人员编制数据管理计划,帮助科研人员在科研过程中用一定的标准化的平台收集、组织、管理、分享、重用和看护数据,包括提供有关数据权利(Open Data Policies)和开放的法律问题的咨询,以及提交成果时满足管理机构对数据管理的要求。

这是一个很好的问题:举一个例子,数据是否/如何改变了你的行业,或你的生活?为什么?
基因测序从2亿美元降低到1000美元就是一个活生生的例子;
生物医药领域很多实验都是以数据作为模拟;
传统行业利用数据更有效,更高效,提供更好的、更精准的服务;
Deep Learning带来的智能化。

CNI: Institutional Research Data Management: Policies, Planning, Services And Surveys

当这三个杂志都在谈论一个话题的时候,你要注意了,这一定错不了。(2012年10月https://www.youtube.com/watch?v=HMrK74IBATo)
数据科学家不仅是软件工程师,应该同时是统计学家。

正像人们不想要文献,只想要内容一样,人们并不想要数据,而想要数据背后的事实、道理、结果等。

Data Science and Statistics: differences worlds?

Published on May 19, 2015

Chris Wiggins (Chief Data Scientist, New York Times)
David Hand (Emeritus Professor of Mathematics, Imperial College)
Francine Bennett (Founder, Mastodon-C)
Patrick Wolfe (Professor of Statistics, UCL / Executive Director, UCL Big Data Institute)
Zoubin Ghahramani (Professor of Machine Learning, University of Cambridge)

Chair: Martin Goodson (Vice-President Data Science, Skimlinks)
Discussant: John Pullinger (UK National Statistician)

In the last few years data science has become an increasingly popular discipline. Often linked to the use and analysis of ‘big data’, data scientists are seen as the new professionals who can unlock the potential of an increasingly data-rich world, and to generate economic and social benefits from the data revolution.

However within the world of statistics, the ‘big data’ and ‘data scientist’ developments are sometimes labelled as hypes, and ‘data science’ is seen as a rebranding of what should be statistics. One of the often heard criticisms of big data analytics is that there’s a lack of statistical rigour which can lead to the wrong decisions.

As with any new discipline there are questions about exactly what data science is. Has the relevance of statistics been diminished because of new types of data or technologies which need a radical new approach? Is data science about ‘getting the job done’, and statistics about the deeper scientific understanding? Are our universities offering students the right skill sets to meet the high demand for data scientists?

目前之所以看这些东西,主要是想找到知识生产(体外知识积累)的逻辑。不了解知识的发端和起源恐怕研究不深。

目前接触到一个新的问题:人的认知是何时开始的?感觉和认知是什么关系?在人工智能研究领域,这也是一个关键问题,而基因决定大脑功能,而最终带来由感觉到认知到突变,最后经过文字社会化,而产生图书馆,对人类社会又产生新的作用。这整个过程(闭环?)中有大量的未知课题值得研究。

Venter在其第一个成功“制造”大人造基因组中加入的“水印”,据他说是为了将其与天然基因组区别开来。这段水印是一段爱尔兰作家和诗人詹姆斯·乔伊斯的诗句:“去活着,去犯错,去跌倒,去胜利,去从生命中创造新生命。”这个经典的句子第一次有了新的载体——蛋白质,而这条水印将跟随人类第一个完整的人造生命写入历史。
http://baike.baidu.com/



留下评论