2018TOP100数据科学资源和工具(上)
本文列举了2018年 的100个数据科学的资源和工具,以帮助数据科学家们更好地学习、工作与提高效率。
1. Anaconda – Python的科学分发
2. Jupyter Notebook – 一种交互式笔记本
3. Tensorflow – 软件库,用于构建和训练神经网络
4. Scikit-Learn – 用于机器学习的Python库
5. Tableau – 一种用于数据分析和可视化的商业智能工具
6. RapidMiner – 用于数据挖掘、机器学习和预测性建模的开源工具
7. NumPy – 用于Python中数值计算的库
8. Pandas – 用于数据处理的Python库
9. Matplotlib – 用于Python的绘图库
10. Plotly – 用于交互式可视化的Python库
11. RStudio – R语言的开发环境
12. ggplot2 – R语言的可视化库
13. Keras – 高级神经网络API,用于Tensorflow、Theano和CNTK
14. PyTorch – 用于科研人员和机器学习工程师的深度学习框架
15. Apache Spark – 大数据处理框架
16. Hadoop – 大数据处理的分布式系统
17. Apache Hive – 大数据的数据仓库
18. Apache Drill – 分布式SQL查询框架
19. Apache Cassandra – 高性能NoSQL数据库
20. MongoDB – 极简主义、灵活的NoSQL文档数据库
21. Git – 版本控制系统
22. Github – 基于Git的开源代码托管平台
23. PyCharm – Python的集成开发环境
24. IntelliJ IDEA – Java的集成开发环境
25. Eclipse – 多语言的集成开发环境
26. Sublime Text – 代码编辑器
27. Atom – GitHub开发的文本编辑器
28. Visual Studio Code – 微软发布的轻量级代码编辑器
29. Notepad++ – Windows用户的文本编辑器
30. Vim – Unix风格的编辑器
31. LaTeX – 一种排版系统
32. Overleaf – 一种在线的LaTeX编辑器
33. BibDesk – 用于管理文献参考的Mac应用程序
34. Mendeley – 一种免费的基于Web和桌面的参考管理软件
35. Zotero – 免费的、开源的、跨平台的参考管理软件
36. EndNote – 商业的参考管理软件
37. Knime – 用于数据科学的开源平台
38. Weka – 用于数据挖掘的机器学习软件
39. Orange – 用于数据挖掘、机器学习、网络分析和可视化的开源数据科学工具
40. TensorFlow Playground – 用于神经网络的可视化工具
41. OpenCV – 开源计算机视觉库
42. DLIB – C++的机器学习库
43. Caffe – 用于深度学习的开源框架
44. Theano – 用于Python的数学库,用于定义、优化并评估数学表达式,尤其是用于深度学习
45. MXNet – 分布式、可移植且高效的深度学习框架
46. Torch – 用Lua语言编写的科学计算框架
47. Justin – 用于定义、优化和评估深度学习模型的Python库
48. Databricks – 用于Spark、Hadoop的云平台
49. Dataiku – 用于数据科学的平台
50. Alteryx – 技能基于数据的自助服务和工作流程自动化的数据科学平台
51. Kaggle – 数据科学竞赛平台
52. CrowdFlower – 人力数据标注服务
53. AWS Sagemaker – 亚马逊用于机器学习的云平台
54. IBM Watson – 用于AI和机器学习的IBM的云平台
55. Azure Machine Learning – 微软用于机器学习的云平台
56. Google Cloud Machine Learning – 谷歌用于机器学习的云平台
57. DASH – Python的Web应用程序框架
58. Flask – Python的Web应用程序框架
59. Ruby on Rails – 用于Web开发的开源Web应用程序框架
60. Node.js – 用于构建可扩展网络应用程序的JavaScript运行时
61. JSON – 一种轻量级数据交换格式
62. CSV – 一种简单的数据交换格式
63. XML – 一种标准的数据交换格式,用于Web服务和分布式应用程序
64. YAML – 一种人类可读的数据序列化格式
65. JSON-LD – 一个轻量级的Linked Data格式
66. RDF – 一种用于表示信息资源的Web资源描述框架
67. OWL – 一种用于定义本体的语言
68. SPARQL – 使用来查询RDF图的标准语言。
69. DBpedia – 从维基百科数据中构建的半结构化的知识图
70. Google Knowledge Graph – 谷歌构建的一个基于搜索响应的知识图
71. PyMQI – Python的WebSphere MQ客户端API
72. ZeroMQ – 高性能的、异步的消息传递库
73. Apache Kafka – 分布式的、高性能的、容错的消息传递系统
74. Redis – 开源的内存数据结构存储,用作数据库、缓存和消息代理。
75. Apache ActiveMQ – 开源消息传递系统
76. RabbitMQ – 开源消息传递系统
77. Facebook Prophet – 趋势预测的Python库
78. Statsmodels – 用于统计分析的Python库
79. Google Analytics – 谷歌用于网站流量分析和电子商务跟踪的云服务
80. Mixpanel – 以用户行为为中心的分析工具
81. IBM Cognos Analytics – 企业级商业智能工具
82. IBM SPSS – 统计分析软件
83. Microsoft Excel – 电子表格软件
84. Microsoft Power BI – 商业智能工具
85. QlikView – 商业智能工具
86. SAS – 统计分析软件
87. TIBCO Spotfire – 商业智能工具
88. Tableau Prep – 数据准备工具
89. Trifacta – 数据准备和清理工具
90. RapidMiner Studio – 数据挖掘和分析工具
91. AlgoTrades – 用于自动交易的计算机程序
92. Quantopian – 基于Python的算法交易平台
93. TradingView – 交易图表和报价平台
94. NinjaTrader – 用于股票/期货/外汇/选项、数据分析和自动交易的开发和管理交易系统的开发平台
95. Myfxbook – 外汇交易日志和交易分析平台
96. QuantConnect – 具有持续性和即时跟踪能力的云平台来开发、回测和运行交易算法
97. eSignal – 用于股票/期货/外汇等建立交易信号和执行交易的高级软件
98. Wealth-Lab – 用于股票/期货/外
