PT Vision(GPT-4V)吸引了全球AI用戶的注意。人工智慧的新進步並沒有帶來通常的悲觀情緒,這種新功能激發了人工智慧社群的興奮和興趣。
摘要[顯示]
ChatGPT 願景是什麼?
GPT-4V 是一種多模態廣泛語言模型,除了文字提示之外,還可以解釋圖像,有可能重新定義人們使用人工智慧的方式。透過每月 20 美元的 ChatGPT Plus 帳戶,用戶可以將圖像上傳到 iOS 或 Android 上的 ChatGPT 應用程式並提出問題。例如,用戶可以上傳餐廳用餐的照片並詢問“我該怎麼做?” » 聊天機器人將分析影像並提供建議的食譜。
這個新功能的可能性似乎是無窮無盡的。 OpenAI 認為
多模態是人工智慧研究和開發的關鍵前沿,擴大了這些系統可以幫助使用者的任務範圍。微軟研究人員小組表示,GPT-4V 可能會催生新的人機互動方法,標誌著 LLM(大型語言模型)的到來。
借助 ChatGPT Vision,使用者現在可以將圖像或螢幕截圖添加到基於文字的提示中,從而允許 AI 處理和執行以前透過簡單文字輸入無法實現的任務。此功能以及其他有用的 GPT-4 功能可供進階使用者使用。
如果您有權存取 ChatGPT Vision,您將在文字方塊左側看到一個小圖像圖示。只需按一下它即可附加裝置上儲存的任何影像,或將複製的影像貼到剪貼簿。
根據圖像的上下文,您可以選擇除了圖像之外輸入 香港電子郵件列表 文字提示,或者只是讓 ChatGPT 完成其工作並分析附加的圖像。以下是您可以利用 ChatGPT Vision 的一些方法:
1. 辨識物體或描述影像
ChatGPT Vision 讓我們當中的好奇者能夠更輕鬆地識別我們在社交媒體上或在繁忙的街道上行走時遇到的最隨機的物體。無論是獨特的測速相機還是外觀時髦的耳機,ChatGPT Vision 都能夠高精度識別物體。
此外,如果您無法用語言表達自己的想法並需
要描述圖像的幫助,ChatGPT 的 Vision 功能可以為您提 科技如何改變汽車產業 圖像的詳細文字描述。此功能對於需要圖像識別或描述幫助的個人非常有用。有了 ChatGPT Vision,辨識物體和描述影像變得輕而易舉!
2. 識別人物
ChatGPT 是一個很好的工具,用於識別流行媒體(包括電視節目、電影和動漫)中的角色。如果您無法辨識儲存在手機上的迷因中的角色,ChatGPT Vision 可以提供協助。
但是,該工具的功能存在一些限制。它不會提取有關真人的信息,並且 ChatGPT Vision 在關聯真人的身份時劃出了嚴格的界限。雖然它仍然可以識別真人電影並 馬來西亞數據 顯示角色,但它不會越界並提供任何可能與真人相關的資訊。