AlchemyLanguage
AlchemyLanguage 是一组文本分析方法,可以更深入地了解你的文本或 HTML 内容。请参阅入门主题以了解如何开始使用 AlchemyLanguage 和其他 Watson 服务。有关 AlchemyLanguage 的更多详细信息和示例,请参阅 API 参考和文档 。
尺寸限制
- 文本清理前的 HTML 内容: 600 KB
- 文本清理后的源文本: 50 KB
- 使用自定义模型的调用: 5 KB
语言支持
要查看每个函数支持哪些语言,请参阅 API 参考中的每个函数的条目。
语言检测
默认情况下,AlchemyLanguage 会自动检测源文本的语言。你可以使用 language
查询参数手动指定内容的语言。 (例如 language=spanish
)
文字清理
当你使用 API的 HTML 或 URL 功能时,AlchemyLanguage 会清除内容以准备分析的源文本。sourceText
参数允许你使用以下选项自定义清洁过程:
cleaned_or_raw
(默认) - 删除网站元素,如链接,广告等。如果清除失败,则使用原始网页文本cleaned
–删除网站元素,如链接,广告等。raw
- 使用原始网页文本而不进行清理cquery
- 使用你在cquery
参数中指定的视觉约束查询。有关可视约束查询的详细信息,请参阅文档 。xpath
- 使用你在xpath
参数中指定的 XPath 查询xpath_or_raw
- 使用 XPath 查询的结果,如果 XPath 查询没有返回任何内容,则返回纯文本cleaned_and_xpath
- 在已清理的网页文本上使用 XPath 查询的结果