Peak Labs

Peak Labs

Peak Labs从零开始为Magi项目创建了整个技术堆栈。从自然语言理解到Web规模的搜索引擎,这些经过考验的产品可随时帮助您增强业务并为您的客户带来Magi体验。

伊鲁尔

神经信息提取系统

Ireul神经信息提取引擎具有详尽的开放信息提取(OIE)的独特功能。Ireul理解通过自然语言表达的知识,并将其转换为结构化数据,从而实现自动知识库构建和众多商业智能应用程序。

通过多个专门设计的神经网络和假设搜索算法,Ireul能够利用深入的语义特征并促进多语言迁移学习,并在零资源的情况下在多种语言上获得令人满意的结果。

与传统的信息提取系统不同,Ireul放弃了人工设置的规则,语义角色标签,依赖项解析以及其他限制系统泛化能力的技术,从而使Ireul在处理交叉信息,长期依赖项,Winograd Schema,和其他复杂情况。

拉米尔

网络规模搜索引擎

Ramiel是一款性能驱动的全文本搜索引擎,具有经过TLA +验证的原始索引结构,可确保在任何规模下均具有出色的响应速度和可靠的结果质量。

简洁的数据结构充分利用了不同的存储介质,与定制的基于机器学习的排名算法配合使用,并实现了令牌级增量更新和基于概率的各种提前终止策略。

Ramiel还原生支持用于分片和复制的内置协议的分布式部署。

阿拉雷

多语言分析管道

Arael为自然语言的分析提供了基本的支持,能够以流的形式处理170多种不同的语言。对于中文,日文,韩文,泰文等语言,Arael可以使用机器学习来处理重叠的歧义和词汇外的词/短语。

Arael不仅可以分割基本字素,单词/短语和句子,而且还可以配置分析器和过滤器以构成定制的工作流程。

此外,Arael还实施了Unicode®标准附件#29和技术标准#51,翻译:永不被Emojis搞砸!

马塔雷尔

分布式检索系统

Matarael是符合标准的分布式爬网系统,能够以Internet规模对数据进行爬网和分析。

我们没有使用肿的无头浏览器,而是遵循IETF RFC和W3C的众多标准从正方形设计了Matarael,从而实现了高效的基于流的爬网以及对JavaScript等高级功能的全面支持。我们非常重视合规性,因此Matarael会遵循robots.txt,X-Robots-Tag和所有“机器人排除协议”变体。

Matarael还支持在各种存储后端上进行分布式Web Graph构建和Map-Reduce分析。

传送门

评论

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×