欢迎访问宙启技术站
智能推送

2018TOP100数据科学资源和工具(上)

发布时间:2023-05-15 17:52:03

本文列举了2018年 的100个数据科学的资源和工具,以帮助数据科学家们更好地学习、工作与提高效率。

1. Anaconda – Python的科学分发

2. Jupyter Notebook – 一种交互式笔记本

3. Tensorflow – 软件库,用于构建和训练神经网络

4. Scikit-Learn – 用于机器学习的Python库

5. Tableau – 一种用于数据分析和可视化的商业智能工具

6. RapidMiner – 用于数据挖掘、机器学习和预测性建模的开源工具

7. NumPy – 用于Python中数值计算的库

8. Pandas – 用于数据处理的Python库

9. Matplotlib – 用于Python的绘图库

10. Plotly – 用于交互式可视化的Python库

11. RStudio – R语言的开发环境

12. ggplot2 – R语言的可视化库

13. Keras – 高级神经网络API,用于Tensorflow、Theano和CNTK

14. PyTorch – 用于科研人员和机器学习工程师的深度学习框架

15. Apache Spark – 大数据处理框架

16. Hadoop – 大数据处理的分布式系统

17. Apache Hive – 大数据的数据仓库

18. Apache Drill – 分布式SQL查询框架

19. Apache Cassandra – 高性能NoSQL数据库

20. MongoDB – 极简主义、灵活的NoSQL文档数据库

21. Git – 版本控制系统

22. Github – 基于Git的开源代码托管平台

23. PyCharm – Python的集成开发环境

24. IntelliJ IDEA – Java的集成开发环境

25. Eclipse – 多语言的集成开发环境

26. Sublime Text – 代码编辑器

27. Atom – GitHub开发的文本编辑器

28. Visual Studio Code – 微软发布的轻量级代码编辑器

29. Notepad++ – Windows用户的文本编辑器

30. Vim – Unix风格的编辑器

31. LaTeX – 一种排版系统

32. Overleaf – 一种在线的LaTeX编辑器

33. BibDesk – 用于管理文献参考的Mac应用程序

34. Mendeley – 一种免费的基于Web和桌面的参考管理软件

35. Zotero – 免费的、开源的、跨平台的参考管理软件

36. EndNote – 商业的参考管理软件

37. Knime – 用于数据科学的开源平台

38. Weka – 用于数据挖掘的机器学习软件

39. Orange – 用于数据挖掘、机器学习、网络分析和可视化的开源数据科学工具

40. TensorFlow Playground – 用于神经网络的可视化工具 

41. OpenCV – 开源计算机视觉库

42. DLIB – C++的机器学习库

43. Caffe – 用于深度学习的开源框架

44. Theano – 用于Python的数学库,用于定义、优化并评估数学表达式,尤其是用于深度学习

45. MXNet – 分布式、可移植且高效的深度学习框架

46. Torch – 用Lua语言编写的科学计算框架

47. Justin – 用于定义、优化和评估深度学习模型的Python库

48. Databricks – 用于Spark、Hadoop的云平台

49. Dataiku – 用于数据科学的平台

50. Alteryx – 技能基于数据的自助服务和工作流程自动化的数据科学平台

51. Kaggle – 数据科学竞赛平台

52. CrowdFlower – 人力数据标注服务

53. AWS Sagemaker – 亚马逊用于机器学习的云平台

54. IBM Watson – 用于AI和机器学习的IBM的云平台

55. Azure Machine Learning – 微软用于机器学习的云平台

56. Google Cloud Machine Learning – 谷歌用于机器学习的云平台

57. DASH – Python的Web应用程序框架

58. Flask – Python的Web应用程序框架

59. Ruby on Rails – 用于Web开发的开源Web应用程序框架

60. Node.js – 用于构建可扩展网络应用程序的JavaScript运行时

61. JSON – 一种轻量级数据交换格式

62. CSV – 一种简单的数据交换格式

63. XML – 一种标准的数据交换格式,用于Web服务和分布式应用程序

64. YAML – 一种人类可读的数据序列化格式

65. JSON-LD – 一个轻量级的Linked Data格式

66. RDF – 一种用于表示信息资源的Web资源描述框架

67. OWL – 一种用于定义本体的语言

68. SPARQL – 使用来查询RDF图的标准语言。 

69. DBpedia – 从维基百科数据中构建的半结构化的知识图

70. Google Knowledge Graph – 谷歌构建的一个基于搜索响应的知识图

71. PyMQI – Python的WebSphere MQ客户端API

72. ZeroMQ – 高性能的、异步的消息传递库

73. Apache Kafka – 分布式的、高性能的、容错的消息传递系统

74. Redis – 开源的内存数据结构存储,用作数据库、缓存和消息代理。

75. Apache ActiveMQ – 开源消息传递系统

76. RabbitMQ – 开源消息传递系统

77. Facebook Prophet – 趋势预测的Python库

78. Statsmodels – 用于统计分析的Python库

79. Google Analytics – 谷歌用于网站流量分析和电子商务跟踪的云服务

80. Mixpanel – 以用户行为为中心的分析工具

81. IBM Cognos Analytics – 企业级商业智能工具

82. IBM SPSS – 统计分析软件

83. Microsoft Excel – 电子表格软件

84. Microsoft Power BI – 商业智能工具

85. QlikView – 商业智能工具

86. SAS – 统计分析软件

87. TIBCO Spotfire – 商业智能工具

88. Tableau Prep – 数据准备工具

89. Trifacta – 数据准备和清理工具

90. RapidMiner Studio – 数据挖掘和分析工具

91. AlgoTrades – 用于自动交易的计算机程序

92. Quantopian – 基于Python的算法交易平台

93. TradingView – 交易图表和报价平台

94. NinjaTrader – 用于股票/期货/外汇/选项、数据分析和自动交易的开发和管理交易系统的开发平台

95. Myfxbook – 外汇交易日志和交易分析平台

96. QuantConnect – 具有持续性和即时跟踪能力的云平台来开发、回测和运行交易算法

97. eSignal – 用于股票/期货/外汇等建立交易信号和执行交易的高级软件

98. Wealth-Lab – 用于股票/期货/外