當一個人,組或程序決定在一個文檔或文本中應該包含或排除哪些信息。它與圍繞文檔結構的概念有關,也與自然語言生成和計算語言學有關。每個研究領域都使用內容確定來檢查如何選擇信息。 內容確定包括將文本中的信息縮減...
當一個人,組或程序決定在一個文檔或文本中應該包含或排除哪些信息。它與圍繞文檔結構的概念有關,也與自然語言生成和計算語言學有關。每個研究領域都使用內容確定來檢查如何選擇信息。

內容確定包括將文本中的信息縮減為最終文檔的方式。當考慮在文檔或文本中放入什么時,編輯者將進行他或她的研究或將得到所有可用的數據。內容確定包括將這些信息縮減成最終文檔的方式。這是通過確定文本的角度或目標以及文本中與此相關的信息來完成的對內容決定的考慮是其風格。這往往取決于目標受眾的性質。受眾的智力和對主題的熟悉程度將改變所傳遞信息的詞匯密度和復雜性。例如,學術界傾向于產生比八卦雜志更密集的文本其他的考慮因素包括格式的大小,無論是一本書、一篇文章還是一條短信。內容的每一種狀態都是由一個人來決定的。有研究者和作者,他們通常是同一個人,但并不總是同一個人,然后是一個或多個編輯。每一個層次都對內容相關的內容有自己的看法本文的目的。計算語言學家和計算機工程師一直在尋找使用計算機程序而不是依靠人類來重現這個系統的方法。在內容確定方面,計算機采用了三種計算技術"圖式技術"是以書面文本的檢查為基礎的。它使用預先檢查過的文本作為基礎,在生成的文本中包含哪些信息。"統計"方法根據大量的一般統計數據自動確定內容。"顯式推理"使用人工智能(AI)檢查和過濾信息。內容確定的總體目標是了解文件是如何產生的,以便用計算機復制。這樣成功的結果將是計算機能夠接收數據、過濾數據并生成最重要信息的摘要。計算機將以這些文件為基礎而不是根據中國房理論,這可能意味著計算機能夠理解數據,而不是能夠復制和計算。