AlchemyLanguage
AlchemyLanguage 是一組文字分析方法,可以更深入地瞭解你的文字或 HTML 內容。請參閱入門主題以瞭解如何開始使用 AlchemyLanguage 和其他 Watson 服務。有關 AlchemyLanguage 的更多詳細資訊和示例,請參閱 API 參考和文件 。
尺寸限制
- 文字清理前的 HTML 內容: 600 KB
- 文字清理後的源文字: 50 KB
- 使用自定義模型的呼叫: 5 KB
語言支援
要檢視每個函式支援哪些語言,請參閱 API 參考中的每個函式的條目。
語言檢測
預設情況下,AlchemyLanguage 會自動檢測源文字的語言。你可以使用 language
查詢引數手動指定內容的語言。 (例如 language=spanish
)
文字清理
當你使用 API的 HTML 或 URL 功能時,AlchemyLanguage 會清除內容以準備分析的源文字。sourceText
引數允許你使用以下選項自定義清潔過程:
cleaned_or_raw
(預設) - 刪除網站元素,如連結,廣告等。如果清除失敗,則使用原始網頁文字cleaned
–刪除網站元素,如連結,廣告等。raw
- 使用原始網頁文字而不進行清理cquery
- 使用你在cquery
引數中指定的視覺約束查詢。有關可視約束查詢的詳細資訊,請參閱文件 。xpath
- 使用你在xpath
引數中指定的 XPath 查詢xpath_or_raw
- 使用 XPath 查詢的結果,如果 XPath 查詢沒有返回任何內容,則返回純文字cleaned_and_xpath
- 在已清理的網頁文字上使用 XPath 查詢的結果