机器学习语音识别(从人脸识别到机器翻译)
机器学习语音识别(从人脸识别到机器翻译)预测和其它机器学习语言翻译本文所有的 API 分成以下四组:面部和图像识别文本分析、自然语言处理、情绪分析
机器之心编译
参与:吴攀
工智能正在成为新一代技术变革的基础技术,但从头开始为自己的应用和业务开发人工智能程序既成本高昂,且往往很难达到自己想要的性能表现,但好在我们有大量现成可用的 API 可以使用。
开发者可以通过这些 API 将其它公司提供的智能识别、媒体监测和定向广告等人工智能服务集成到自己的产品中。机器之心在 2015 年底就曾经编译过一篇介绍当前优质人工智能和机器学习 API 的文章《技术 | 50个常用的人工智能和机器学习API》,列举了 50 个较为常用的涉及到机器学习、推理预测、文本分析及归类、人脸识别、语言翻译等多个方面的 API。一年多过去了,好用的 API 也出现了一些新旧更迭,现在是时候对这篇文章进行更新了。
本文所有的 API 分成以下四组:
-
面部和图像识别
-
文本分析、自然语言处理、情绪分析
-
语言翻译
-
预测和其它机器学习
每一组我们都是以首字母排序的,相关描述来自其网址链接在 2017 年 2 月 3 日的介绍信息。如果你知道另一些很好的 API 但这里没有收录,一定记得向我们分享!
Bing Spell Check:https://www.microsoft.com/cognitive-services/en-us/bing-spell-check-api
Language Understanding:https://www.microsoft.com/cognitive-services/en-us/language-understanding-intelligent-service-luis
Linguistic Analysis:https://www.microsoft.com/cognitive-services/en-us/linguistic-analysis-api
Web Language Model:https://www.microsoft.com/cognitive-services/en-us/web-language-model-api
9.nlpTools:是一个在 HTTP RESTful 网页服务上简单的 JSON,用于自然语言处理。其能解码在线新闻媒体以进行情感分析和文本分类。链接:http://nlptools.atrilla.net/web/api.php
10.Semantic Biomedical Tagger:有一个内置的功能来识别133种生物实体类型,并且能通过语义分析将其和已有的知识库系统链接起来。链接:http://docs.s4.ontotext.com/display/S4docs/Semantic Biomedical Tagger
11.Thomson Reuters Open Calais™:使用了自然语言处理、机器学习等方法。Calais 能够将你的文档与实体(人、地点、组织等)、事实(人 X 为公司 Y 工作)和事件(人 Z 在时间 X 被任命为公司 Y 的主席)进行归类和链接。链接:http://www.opencalais.com/opencalais-api/
12.Yactraq Speech2Topics:是一个能够通过语音识别 & 自然语言处理将 audio visual 内容转换成主题元数据(topic metadata)的云服务。链接:http://yactraq.com/
语言翻译
1.Google Cloud Translation:可以动态地在数千个语言对之间翻译文本。该 API 让网站和程序可以通过编程的方式来与该翻译服务集成。链接:https://cloud.Google.com/translate/docs/
2.IBM Watson Language Translator:将文本从一种语言翻译成另一种语言。该服务提供了多种特定领域的模型,让你可以基于你独特的术语和语言进行自定义。比如,客户可以用他们自己的语言进行交流。链接:http://www.ibm.com/watson/developercloud/language-translator.html
3.LangId:能快速地从任何种类的语言中提取信息,没有限定任何语言。(即让你能识别你要分析的任何文本的语言)链接:http://langid.net/identify-language-from-api.php
4.Microsoft Cognitive Service - Translator:在翻译之前能够自动检测文本的语言。它支持 9 种语言上的语音翻译和 60 种语言的文本翻译。链接:https://www.microsoft.com/cognitive-services/en-us/text-analytics-api
5.MotaWord:是一个快速的人类翻译平台。其提供了超过70种语言的相互翻译。该API还允许开发者获得每一次翻译的记录、提交带有文档和风格指导的项目、跟踪翻译项目的进度并获得实时活动数据流。链接:https://www.motaword.com/developer
6.WritePath Translation:其API允许开发者在其它应用中接入和整合WritePath的功能。其应用案例包括字数统计、发布翻译文档和检索已翻译的文档和文本。链接:https://www.writepath.co/en/developers
预测和其它机器学习
1.Amazon Machine Learning:可用来找到数据的模式。已有用户使用该API来执行欺诈检测、需求预测、目标市场确定和点击预测分析等任务。链接:https://aws.amazon.com/documentation/machine-learning/
2.BigML:BigML是为基于云的机器学习和数据分析提供的服务。用户可以通过标准的 HTTP 使用基本的监督和非监督机器学习任务设置数据源和创建预测模型。链接:https://bigml.com/api/
3.Ersatz:一个使用基于 GPU 的深度神经网络即服务的基于网页的预测程序。在 Ersatz 中,训练了一组不同的神经网络模型(组合方法),有时候多达 20 个模型。链接:http://www.ersatzlabs.com/documentation/api/
4.Google Cloud Prediction:提供了一个用于构建机器学习模型的 RESTful API。这些工具可以帮助分析你的数据以为你的应用增加各种功能,比如客户情感分析、垃圾检测、推荐系统等。链接:https://cloud.Google.com/prediction/docs/
5.Google Cloud Speech API:使用快速和准确的语音识别来将音频(来自麦克风或文件)转换成文本。支持超过 80 种语言及其变体。链接:https://cloud.Google.com/speech/docs/apis
6.Guesswork.co:为电子商务网站提供产品推荐引擎。Guesswork能够准确预测用户的动机,它使用的是一个运行在Google Prediction API上的语音规则引擎。链接:http://www.guesswork.co/
7.Hutoma:通过一个专有平台来帮助全世界的开发者开发和产品化深度学习聊天机器人,该平台提供了用于创建和分享会话人工智能的工具和通道。链接:https://www.hutoma.com/about.html
8.IBM Watson Conversation:构建理解自然语言的聊天机器人,并将它们部署在消息平台和网站以及任何设备上。链接:https://www.ibm.com/watson/developercloud/conversation.html 。这一类(用于语言的认知服务)的 API 还包括:
-
Dialog:https://www.ibm.com/watson/developercloud/dialog.html
-
Natural Language Classifier:https://www.ibm.com/watson/developercloud/nl-classifier.html
-
Personality Insights:https://www.ibm.com/watson/developercloud/personality-insights.html
-
Document Conversion:https://www.ibm.com/watson/developercloud/document-conversion.html
-
Tone Analyzer:https://www.ibm.com/watson/developercloud/tone-analyzer.html
9.IBM Watson Speech:包括「语音转文本」和「文本转语音」。(用于比如,转录呼叫中心的对话或创建语音控制的应用)
-
语音转文本:https://www.ibm.com/watson/developercloud/speech-to-text.html
-
文本转语音:https://www.ibm.com/watson/developercloud/text-to-speech.html
10.IBM Watson Data Insights:这个集合包含 3 个 API:AlchemyData News、Discovery 和 Tradeoff Analytics。AlchemyData 提供了使用自然语言处理丰富过的新闻和博客内容。Tradeoff Analytics 能帮助人类在平衡多个目标时进行决策。链接:https://www.ibm.com/watson/
11.IBM Watson Retrieve and Rank:开发者可以将自己的数据加载到该服务中,并用已知的相关结果对机器学习模型(Rank)进行训练。服务输出包括一个相关文档和元数据列表。比如,一个联络中心代理可以快速找到能提升平均呼叫处理时间的答案。链接:http://www.ibm.com/watson/developercloud/retrieve-rank.html
12.Imagga:提供了能为你的图像自动分配标签的 API,让你的图像可被查找。其基于一个图像识别的平台及服务。链接:https://imagga.com/solutions/auto-tagging.html
13.indico:提供文本分析(如,情感分析、Twitter 参与、情绪)和图像分析(如,面部情绪、面部定位)。indico API是可以免费使用的,也不需要提供训练数据。链接:https://indico.io/docs
14.Microsoft Azure Cognitive Service API:正在替代 Azure Machine Learning Recommendations 服务,提供基于预测分析的解决方案。其能为客户提供个性化的产品推荐和提升销售成绩。这个新版本有新的功能,比如批量支持、更好的 API Explorer、更清爽的 API 界面、更一致的注册和支付体验等。链接:https://azure.microsoft.com/en-au/services/cognitive-services/
15.Microsoft Azure Anomaly Detection API:使用时间中均匀间隔的数值来检测时序数据中的异常。比如,当检测计算中的内存使用时,一个上升趋势可能是相关的,因为其可能指示了着内存泄露。链接:https://gallery.cortanaintelligence.com/MachineLearningAPI/Anomaly-Detection-2
16.Microsoft Cognitive Service - QnA Maker:将信息提炼成对话式的、易于浏览的答案。链接:https://www.microsoft.com/cognitive-services/en-us/qnamaker 。这一组(用于知识的认知服务)的 API 还包括:
-
Academic Knowledge:https://www.microsoft.com/cognitive-services/en-us/academic-knowledge-api
-
Entity Linking:https://www.microsoft.com/cognitive-services/en-us/entity-linking-intelligence-service
-
Knowledge Exploration:https://www.microsoft.com/cognitive-services/en-us/knowledge-exploration-service
-
Recommendations:https://www.microsoft.com/cognitive-services/en-us/recommendations-api
17.Microsoft Cognitive Service - Speaker Recognition:让你的应用能知道是谁在说话。链接:https://www.microsoft.com/cognitive-services/en-us/speaker-recognition-api 。在同一组(用于语音的认知服务)的 API 包括:
-
Bing Speech(将语音转换成文本,然后转换回来,并理解其目的):https://www.microsoft.com/cognitive-services/en-us/speech-api
-
Custom Recognition:https://www.microsoft.com/cognitive-services/en-us/custom-recognition-intelligent-service-cris
18.NuPIC:是一个用 Python / C 编写的开源项目,实现了 Numenta 的 Cortical Learning Algorithm,由 NuPIC 社区维护。该 API允许开发者使用原始算法进行工作,并可以将多个不同的领域(包括数据的不同层次)放到一起协同,并且还能利用其它平台的功能。链接:https://github.com/numenta/nupic/wiki/NuPIC-API---A-bird's-eye-view
19.PredicSis:通过预测分析获取大数据的强大见解和提升市场营销的表现。链接:https://predicsis.ai/
20.PredictionIO:PredictionIO是一个构建与 Apache Spark、HBase 和 Spray 之上的开源的机器学习服务器,按 Apache 2.0 证书发布。目前给出的API实例已经能实现创建和管理用户和用户记录、检索项目和内容、创建和管理基于用户的推荐等功能了。链接:http://predictionio.incubator.apache.org/index.html
21.RxNLP – Cluster Sentences and Short Texts:一个文本挖掘和自然语言处理服务。其中的Cluster Sentences API可以用来将句子(比如从不同的新闻源采集的内容)和短文本(比如Twitter和Facebook的状态更新)组织成逻辑分组。链接:http://www.rxnlp.com/api-reference/cluster-sentences-api-reference/
22.Sightcorp F.A.C.E:这是一个网页服务,允许第三方应用更好地了解用户行为,并且还能从面部分析中得到用户的年龄、性别、种族、面部表情、头部姿态等信息。链接:http://face.sightcorp.com/doc_swagger/
其它资源
以下两个资源能看到其它 API 列表:
-
Mashape Blog:http://blog.mashape.com/list-of-20-sentiment-analysis-apis/
-
Programmable Web:http://www.programmableweb.com/news/t