SERVICE PHONE

400-123-4657
  • 诚信为本,市场在变,诚信永远不变...

行业资讯

当前位置: 首页 > 杏耀动态 > 行业资讯

15 个顶级的开源人工智能工具推荐

发布时间:2023-10-21 点击量:101


15 个顶级的开源人工智能工具

AI人工智能是目前科技研究中最热门的方向之一。


像 IBM、微软、Facebook、谷歌和亚马逊等硅谷巨头公司都在研发上投入大量的资金、或者收购那些在机器学习、神经网络、自然语言和图像处理等领域取得了进展的初创公司。


斯坦福的专家也在人工智能报告中得出结论:“越来越强大的人工智能应用,可能会对我们的社会和经济产生深远的积极影响,这将出现在从现在到 2030 年的时间段里。


本文,我们将聚焦于开源的人工智能工具,详细了解目前最著名的 15 个开源人工智能项目。


以下这些开源人工智能应用都处于人工智能研究的最前沿。


1、CNTK





它是计算网络工具包Computational Network Toolkit的缩写,CNTK 是一个微软的开源人工智能工具。


不论是在单个 CPU和GPU、多个 GPU 或拥有多个 GPU 的多台机器上,它都有优异的表现。微软主要用它做语音识别的研究,但是它在机器翻译、文本处理、图像字幕、图像识别、语言理解和语言建模方面都有着良好的应用。



2、DMTK



DMTK 是Distributed Machine Learning Toolkit(分布式机器学习工具)的缩写,和 CNTK 一样,是微软的开源人工智能工具。用于大数据的应用程序,它的目标是更快的训练人工智能系统。


DMTK 主要包括三个组件:

DMTK 框架

LightLDA 主题模型算法

分布式(多义)字嵌入算法


为了证明它的速度,微软声称在一个八集群的机器上,能够“用 100 万个主题和 1000 万个单词的词汇表(总共 10 万亿参数)训练一个主题模型,在一个文档中收集 1000 亿个符号,”。


这一成绩是别的工具无法比拟的。



3、Caffe



Caffe是由贾扬清在加州大学伯克利分校读博时创造的, 是一个基于表达体系结构和可扩展代码的深度学习框架。使它声名鹊起的是速度,这使它非常受到研究人员和企业用户的欢迎。


根据其网站所言,它可以在一天之内只用一个 NVIDIA K40 GPU 处理 6000 万多个图像。它是由伯克利视野和学习中心(BVLC)管理的,并且由 NVIDIA 和亚马逊等公司资助来支持它的发展。



4、Deeplearning4j



Deeplearning4j 是一个 java 虚拟机(JVM)的开源深度学习库。它运行在分布式环境并且集成在Apache Spark 和 Hadoop 中。这使它可以配置深度神经网络,并且它与Scala 、 Java和 其他 JVM 语言兼容。



5、Mahout



它是 Apache 基金会项目,Mahout 是一个开源机器学习框架。


据其官方网站所言,Mahout 有三个主要的特性:


一个构建可扩展算法的编程环境

像 Spark 和 H2O 一样的预制算法工具

一个叫 Samsara 的矢量数学实验环境


目前使用 Mahout 的公司有 埃森哲咨询公司、Adobe、英特尔、领英、Twitter、Foursquare、雅虎和其他许多公司。



6、H20



相比起科研,H2O 更注重将 AI 服务于企业用户,因此 H2O 有着大量的公司客户,比如美国第一资本金融公司、Nielsen Catalina、思科、PayPal 和泛美等等,都是它的用户。


它声称任何人都可以利用机器学习和预测分析的力量来解决业务难题。可以用于预测建模、保险分析、风险和欺诈分析、医疗保健、广告技术和客户情报。


它有两种开源版本: Sparking Water 版和标准版 H2O ,被集成在 Apache Spark 中。也有付费的企业用户支持。



7、MLlib



因为它的速度,Apache Spark 成为目前最流行的大数据处理工具。


MLlib 是 Spark 的可扩展机器学习库。它集成了 Hadoop 并可以与 NumPy 和 R 进行交互操作。


它包括了许多机器学习算法如分类、决策树、推荐、主题建模、集群、功能转换、模型评价、生存分析、ML 管道架构、ML 持久、频繁项集和序列模式挖掘、分布式线性代数和统计。



8、OpenNN



作为一个为开发者和科研人员设计的具有高级理解力的人工智能,OpenNN 是一个实现神经网络算法的 c++ 编程库。


其关键特性包括深度的架构和快速的性能。其网站上可以查到丰富的文档,包括一个解释了神经网络的基本知识的入门教程。OpenNN 的付费支持由一家从事预测分析的西班牙公司 Artelnics 提供。



9、NuPIC





由 Numenta 公司管理的 NuPIC 是一个基于分层暂时记忆Hierarchical Temporal Memory,HTM理论的开源人工智能项目。


从本质上讲,HTM 试图创建一个计算机系统来模仿人类大脑皮层。他们的目标是创造一个 “在许多认知任务上接近或者超越人类认知能力” 的机器。


除了开源许可,Numenta 还提供 NuPic 的商业许可协议,并且它还提供技术专利的许可证。



10、Oryx 2



构建在 Apache Spark 和 Kafka 之上的 Oryx 2 是一个专门针对大规模机器学习的应用程序开发框架。它采用一个独特的三层 λ 架构。


开发者可以使用 Orys 2 创建新的应用程序,另外它还拥有一些预先构建的应用程序可以用于常见的大数据任务比如协同过滤、分类、回归和聚类。大数据工具供应商 Cloudera 创造了最初的 Oryx 1 项目并且一直积极参与持续发展。



11、OpenCyc



由 Cycorp 公司开发的 OpenCyc 提供了对 Cyc 知识库的访问和常识推理引擎。它拥有超过 239,000 个条目,大约 2,093,000 个三元组和大约 69,000 owl:这是一种类似于链接到外部语义库的命名空间。


它在富领域模型、语义数据集成、文本理解、特殊领域的专家系统和游戏 AI 中有着良好的应用。


该公司还提供另外两个版本的 Cyc:一个可免费的用于科研但是不开源,和一个提供给企业的但是需要付费。



12、SystenML



最初由 IBM 开发, SystemML 现在是一个 Apache 大数据项目。


它提供了一个高度可伸缩的平台,可以实现高等数学运算,并且它的算法用 R 或一种类似 python 的语法写成。


企业已经在使用它来跟踪汽车维修客户服务、规划机场交通和连接社会媒体数据与银行客户。它可以在 Spark 或 Hadoop 上运行。



13、PredictionIO



今年的二月,Salesforce 收购了 PredictionIO,紧接着在七月,将该平台和商标贡献给 Apache 基金会,Apache 基金会将其列为孵育计划。


所以当 Salesforce 利用 PredictionIO 技术来提升它的机器学习能力时,成效将会同步出现在开源版本中。


它可以帮助用户创建带有机器学习功能的预测引擎,这可用于部署能够实时动态查询的 Web 服务。



14、Torch



Torch 把自己描述为:“一个优先使用 GPU 的,拥有机器学习算法广泛支持的科学计算框架”,特点是灵活性和速度。


另外,Torch可以很容易的通过软件包用于计算机视觉、机器学习、信号处理、并行处理、视频、图像、音频和网络等方面。依赖一个叫做 LuaJIT 的脚本语言,而 LuaJIT 是基于 Lua 的。



15、TensorFlow



TensorFlow 是一个谷歌的开源人工智能工具。提供了一个使用数据流图进行数值计算的库。


TensorFlow 可以运行在多种不同的有着单或多GPU 和 CPU的系统,甚至可以在移动设备上运行。拥有深厚的灵活性、真正的可移植性、自动微分功能,并且支持 c++和 Python 。


TensorFlow的网站拥有十分详细的教程列表来帮助开发者和研究人员沉浸于使用或扩展它的功能。


关注公众账号飞马会】获取资料添加微信小助手feimawang001

线上直播活动:【线上直播】基于算法的运维平台架构概述 - 线上活动 - 飞马网

线下峰会活动:FMI2018人工智能与大数据高峰论坛(上海站) - 活动_飞马网 - 飞马网

平台注册入口