中文偽春菜後援會論壇  

打印

[討論] 真AI要判定到什麽程度?

真AI要判定到什麽程度?

因爲我自己是學英語教學的^_^; 所以對字詞分類很熟,可能過幾個月也會去修讀中文對外教育的課程……而關於電腦語法,邏輯可能有點亂,也不知道這種形式中文的有沒有人做過,或是做到了什麽地步。
回到正題:
“白靈子和小貓咪”的句型判断如果加上华和梨那樣的樹形排列字典(當然要加上非常準確的判定程式),能否作出真正的AI呢?
主人输入:
你喜歡 香蕉 嗎?[句组start]关键字[句组end]  
句組:你喜歡。。。嗎?
關鍵字:香蕉

[句組]對照句組詞典[使用情景分類]
=loop对比=〉選出適當的[回應句組]
我(stative verb=情景動詞)。。。。呢!
2*对照单字词典[词典使用情景分类方式]=loop對比出單字分类(喜欢的,不喜欢的)
*比如説關鍵字為香蕉(分類:名詞.水果.不喜歡)
那麽(情景動詞)就會根據分類output不喜歡
+[句組]=我不喜歡……呢!
最後[回应句组start]${关键字暫存}[回应句组end}得出來的結果就會是
==〉我不喜歡香蕉呢!

句組可以分析出來,但因爲字典需要的單字量非常大,恐怕要到數万字,或許可以做成Web2.0外加學習模式……真的很想要這種功能啊>_<;如果有人做出來過,請一定要通知我!或是有人願意合作?我可以自薦負責文法的部分,另外我的繪圖技術可以算是不錯,第一套Shell也快完成了,有點經驗。

TOP

真AI的判定嘛...用圖靈測試好了(不會不知道吧...),不過你不可能真的做到的...

分詞工具的話倒是有現成的哦
海量分詞工具 (不過是簡體的)
http://www.hylanda.com/download/segment/
上面這個東東注冊以後就能下載了
但是要移植到偽春菜身上需要一定的專業基礎,比如C++
實際上我是無責任AI研究個體戶

TOP

感謝!!!我已經在下載了 電腦專業的知識是絕對沒有的,C++的等級是負的,圖靈的故事也是聼您說了才去找來看的,看完了……好感動……我快哭了T_T圖靈好偉大啊!
無論如何,檔案很大……下載后要慢慢看^_^ 還是希望能夠找到合作的人呢:)

TOP

[Report:]
真AI的判定... 個人是認為以下幾點要做到:

1. 辨識 : 先從簡單的, 比較兩組Boolean(是非, 開關), 開始做起. 開關很簡單, 不是開就是關, 比較起來也很簡單, 是一樣或是不一樣. 然後, 比較兩組整數. 整數就有分"大於(不一樣)", "等於(一樣)"或"小於(不一樣)". 然後就是一般數字, 這時候就比較哲學一點, 因為會有人告訴你"2不一定等於2.0"(理論上來說, 那個2只是相當接近2, 而不等於2 -- 也就是說, 2.00001). 看似有點過於挑剔, 但這點就辨識而言很重要, 因為關於挑選.

所以說, 當辨識顏色"紅色"時, 並不能完全拿兩組數字做比較, 用HTML來寫的話, #ff0000#ee0000, 兩組顏色皆為"一般人眼中的紅色", 但是實際上又不是如此. 這時候辨識就有點挑戰性了, 不僅僅是"等於", 而是"因為並沒有超過允許的範圍, 所以是等於"(if not over-limit, return equals.).

簡單來講是這樣, 然後中間這裡還有一串可以寫出一本論文的長篇大論, 像是辨識兩個物件的相同點, 辨識兩個事件的偏差, 辨識所需的辨識值等等... 那一長串就允許個人略過吧. 讓我們直接來看最後的結果.

設想, 你要打電話叫排骨飯外帶, 可是因為個人原因(像是說... 看涼宮春日看到第1, 2, 3... 不論是哪一集...)太忙, 這時候就會要偽春菜幫忙. 無巧不巧, 你常去的那家店今天沒賣排骨飯了(或是賣完了), 這時候偽春菜的反應會有至少兩種 -- 持續通話並問你是否要換雞腿飯, 或是結束電話並問你是否要叫別家的排骨飯(還是連問都不問就點了? 反正看涼宮都看到沒反應了... 這跟"隨便妳"一樣嘛.).

這裡的基本辨識是指, "對排骨飯的執著"和"對商家的執著". 有些人會問啦, 那為什麼不先持續通話, 然後問要不要其他餐點, 不要的話再問是否要換別家. 也就是說, 一氣呵成? 個人的想法是, 就算看起來是一氣呵成, 實際上仍是辨識, 不過辨識的項目為各個"商家的單一物件的執著"(A的排骨飯 vs. A的雞腿飯 vs. B的排骨飯 vs. B的雞腿飯...). 不然的話, 偽春菜很可能將A的全部菜單讀過一遍, 才結束通話, 問你是否要換B的排骨飯云云...
[To be continue...]

TOP

廣義的AI目前是還沒有人做得到
但是如果僅單就特定目標而制作的AI的話
現今早有相當多的例子
像是打贏人腦的西洋棋AI深藍或是MSN機器人、網路AI愛麗絲
在有限的規則內確實能做到近似人類思考的行為迴路

所以在做這類想像的時候
我個人傾向於先設下一個較小而明確的目標
務實的去完成它後
再去思考如何打破框架並設立新的目標

順道一提...
其實我比較想吃炸豬排飯...(被踢)
末月返想 - 創意的存放處
二次元斷層 - 成果展現之所在

惰性是大敵。

TOP

我想要做的是對話AI,昨天去看了http://www.a-i.com/show_tree.asp?id=59&level=2&root=115,似乎那一位Alan也是用詞組判別作出的,接近33万個詞,400個handle,曾經有Scan自己上一句話的功能,現在只對User input反應。
〉Penpen: 感謝回應!您說的
[允許的範圍]
[基本辨識, "對排骨飯的執著"和"對商家的執著"]
似乎就是性格因素,因爲某种性格會說某一種話,應該作爲一種變數影響Output
那我想真正的AI應該是會不停學習,吸收到的東西影響性格,增加變數,然後說出的話會不一樣吧?對話AI不難,恐怕大部分是苦力活……但是學習=〉性格這個功能就比較有挑戰性了。
〉時元:
“我個人傾向於先設下一個較小而明確的目標
務實的去完成它後
再去思考如何打破框架並設立新的目標“
現在我能做的就是把分詞目錄套入偽性格作測試,不過偽春菜loop的基本模式還要研究,如果有範例就好了>.<; 還有text_word裏面詞類的檔名要怎麽寫才正確?天啊……(我真是電腦白癡)所以……我目前的目標就是找到合夥人,哈哈XD

TOP

電腦白痴嗎?
這句話讓我有點不好意思..........

我研究語法1個多月........老實說還是不算了解
只能土法煉鋼....(汗

[ 本帖最後由 楓神枒月 於 2008-1-7 21:26 編輯 ]
到現在還在弄SHELL
絕望阿~我對於到現在才發現SAI的我感到絕望阿(炸
鬼隱中... 閒暇之虞總算畫完3張了(偷懶

TOP

如果是偽春菜的話的確比較偏重對話AI

其實如果有把可能打入的字都設定好的話就夠逼真了....然後接上亂數變化就可以玩出類似AI般的談話....

不過我覺得要做到AI最基本的要素就是感應.....如果無法自動察覺週遭的變化...那麼反應機制再好也沒用....但是這點偽春菜可能做不到吧...........................

所以製作偽春菜核心時.......AI的部分要先打個基礎反應腳本(像是這個要對應的動作是什麼之類的)......然後就繼續開花(?)般的延展吧!
我要一直改造偽春菜的人格們!!+_+
改造改造改造改造改造改造改造改造改造改造改造改造..........

TOP

是啊,同一个问题也起码应该要有乱数变化的回答才有意思呢!没名字您说的最基本要素的确是我卡关的地方(刚起步就摔跟头哈哈……)感应和乱数变化一个也不能少呢……可是我都不会……昏><;
个人认为如果是拟人AI的话,应该要具备“思想”,也就是能够自主地创造……不过总觉得要做到这一点,人类起码要把自己大脑的运作方式分析透彻才行呢……><; 目前如果能作出像模像样的中文Pattern-Matching Chatbot我就很开心了T_T;
>枫神: 我们一起加油吧!上啊!电脑白痴二人组orz

TOP

“不過我覺得要做到AI最基本的要素就是感應.....如果無法自動察覺週遭的變化...那麼反應機制再好也沒用....但是這點偽春菜可能做不到吧...........................”

正好跟我最近想的一樣哦!
因為偽春菜對環境的感知能力實在太有限了,似乎只能感應鼠標吧,一定要說的話似乎還有一些系統變數,比如系統時間什麽的
所以啊,我就想自己編點東西掛上去
這種感覺就像給一個機器人安裝上眼睛、鼻子、耳朵...

想象總是那么的美好...

[ 本帖最後由 holybang 於 2008-1-7 22:54 編輯 ]
實際上我是無責任AI研究個體戶

TOP

〉holybang:您說的是不是像CPU使用度一類的東西?
如果你開了CPU到100超過10分鐘(Penpen的“允許的範圍”概念)
-原因1:開了N多下載
-原因2:還開了N多web browser
偽春菜就會說:
“忙死了!你少開幾個視窗啦!”(對應原因2)

“在我累死之前我要告發你非法下載!”(對應原因1)
啊……最好還能殺毒  能天氣預報也不錯(外掛),或者是根據得到的天氣做出某种反應?……
是我想太多嗎……

TOP

感應器這類的東西其實也有人在寫
這類的程式都被規類在SAORI(套件)之中
來實作某些反應,如:
『讀取現在IE開啟中的網頁網址讓偽春菜進行相關對話』可使用 SAORI geturl.dll
『抽取剪貼簿內容來判斷使用者正在做什麼事』可使用 SAORI txtpaste.dll
『擷取工具列上的視窗名稱來判斷使用者在做什麼事』可使用 SAORI findwin.dll
……等等之類的
光是目前提供的資源就夠做出大量的反應事件
想寫也寫不完

只能說,事在人為啊。
末月返想 - 創意的存放處
二次元斷層 - 成果展現之所在

惰性是大敵。

TOP

老师您举例的几个都是很实用的套件呢 那么杀毒呢杀毒呢? 有没有什么下棋功能外挂呢?(起肖中XD)
对电脑内的状况分析,配合伪春菜性格的对话,一般大家喜欢拟人的还是讲话像AI型的呢?
我最近在想:AI拟人(以这个做为目的的研究)有什么意义呢?应该一大半是对人类本身潜意识的探索吧?

TOP

真的有感應器阿.....那...不知道哪裡能拿到呢= =?

不過就算偽春菜AI再高....能說的話終究還是寫進去的那些字(殘念....)
我要一直改造偽春菜的人格們!!+_+
改造改造改造改造改造改造改造改造改造改造改造改造..........

TOP

果然我還是資歷太潛啊(廢話,才接觸偽春菜多久啊...)
看來我應該把精力用在尋找這些套件上,而不是另起爐灶
實際上我是無責任AI研究個體戶

TOP

引用:
原帖由 utoto 於 2008-1-7 23:14 發表
〉holybang:您說的是不是像CPU使用度一類的東西?
如果你開了CPU到100超過10分鐘(Penpen的“允許的範圍”概念)
-原因1:開了N多下載
-原因2:還開了N多web browser
偽春菜就會說:
“忙死了!你少開幾個視窗啦!”(對應原因2)

“在 ...
恩,我想的就跟這差不多啦
實際上我是無責任AI研究個體戶

TOP

>沒名字 您說:不過就算偽春菜AI再高....能說的話終究還是寫進去的那些字(殘念....)
我們日常說的話,所用的字也是有限的吧:P 我目前還做著人工智能是可以達到和人類同等水平的夢呢^_^ 目前的起點就是Pattern Matching的分析功能……不過還在努力“盯”(沒入腦)您上次介紹的海量,或是抓網路AI狂聊天。超沒效率的……T_T;

>holybang:我也在慢慢摸索……大家一起加油吧~^_^; 我是覺得另起爐灶沒有錯,但是先了解手邊資源才不會走遠路>.>; 日本那邊的開發能力/精力也不是無限的,而且做純用戶很沒癮呵呵~

TOP

看見大家這樣的討論, 我的心情真是很複雜啊(?)

白靈子人格仍然留在關鍵字是沒錯的,那是我個人的極限了(死)
我也想過用一些句子模組來進行分析...........也想過將關鍵字進一步分類......
但我知道問題和困難是相當大的...

1. 幾乎每個人都有自己的一套"溝通語言", 要讓AI普遍理解是困難的
2. 先不說將關鍵字分類, 我現在也卡在純關鍵字判斷問題.........(我是翻譯英文關鍵字庫+修正)
3. 句子模式要夠多也是一個大麻煩......

當然啦. 我要承認我不太會寫程式(死) 我個人也沒有足夠力量實現囧
(孤軍作戰太久了吧?)

究竟偽春菜的AI有何等能耐我也很好奇=W=~
"企圖製造不可能"ing



......逆天果然是我的本性(茶)

TOP

竟然把您釣出來了!我個人對白靈子非常有興趣^_^
目前的使用報告也是覺得適應的句型有點少,但我覺得這是一個方向!不走到頭是不知道值不值得的
句型和單字結合判定......應該是大腦語言思維的一部分啊^_^
二樓holybang聯結的海量分詞可能對您的開發會有幫助也不一定呢^_^V 您的程式語言我還沒完全看懂,不過感覺潛力很大……
或許詞性的部分還能再加強?可以用近,反義詞做出關聯互動嗎?我想一個大字典可能還是需要的……
我現在的實踐是完全沒有Programming成份在内的,模擬人類學習第二語言的方法,純苦力錄入各種情景的對話,用的是舊華和梨的純關鍵字判定……orz 目前我把關鍵字作了分類,利用關鍵字和標點組合基本句型。
目的是想知道這樣AI能夠回答百分之多少的問題……不過很不樂觀,恐怕很快就要碰到瓶頸了……T_T;
我連如何把User輸入的話抓出來都辦不到……可惡啊……>.<; 請問您用的$UserTalkInput需要特別的dll嗎?因爲我找不到kawari中的對應command T_T

[ 本帖最後由 utoto 於 2008-1-9 00:59 編輯 ]

TOP

大家好,我來自大陸,對C/C++和Perl有兩年的程式設計經驗,也曾自己寫過解析器,對自然語言的處理過程有一定瞭解。看到大家對偽春萊AI的製作熱情非常羡慕,有意願做一個能夠回答比較正規語法的偽春萊AI(為方便稱呼下暫稱此AI為AYD)。但自然語言處理是一門交叉學科,不光是對程式和演算法,在語言學,心理學及哲學方面都有相關涉及,因此我深感一人孤軍奮鬥難以做出什麼成績。因此希望和大家一起成立一個新的偽春萊AI專案。
我先說說我的計畫和目標:

1. AYD並不能象人一樣瞭解鬆散的語法(或說錯誤的語法),在很長一段時間中語言學家都認為中文屬於無語法體系,即使是目前也沒有哪個研究院能總結出中文的語法嚴格規則,因此我們的AYD定位於只聽得懂比較正規嚴格的句子(具體文法定位於:上下文無關或正則文法)。
2. AYD的詞彙量大概是3000-6000(視到時對整體演算法性能分析而定),也就是並不會能看懂所有的文字,但是常用的語言也都基本能看懂了。
3. AYD屬於上下文無關,雖然這句話可能會打擊很多人的積極性,但上下文有關的樹分析與上下文無關的語法樹複雜度會呈指數級增長,即使機器勉強能運行得起,這個AI人格也會因吃資源過大而別被人所刪除。當然,為了使用戶在一句話內無法表達清楚意思的情況,我們後面的版本會提供3句話以內的上下文相關(就我目前計算這是比較現實的數量)。
4. 學習系統,這是很複雜的一部分,我承認我對這方面也是剛起步,不過這部分也是AYD最核心的一部分,所以就先把它寫出來。在談話中,AYD遇到她所不認識的字及新詞彙,如果用戶能用比較正規的句子告訴她該字/詞相關的用法,AYD就會自動修改本身的詞彙庫,建立新的知識網路。
5.世界知識庫。除了對句子語法的基本知識庫外,AYD還擁有一個世界知識庫,但與句法及詞彙知識庫所不同的是世界觀知識庫不會一開始就載入記憶體,而是以資料庫的形式存儲於硬碟(初步考慮是用Access,因為SQLite本身問題還是很多,不利於專案的穩定),當用戶與AYD談話AYD分析到世界觀相關的知識詞彙時,將會搜索資料庫相關內容進行組織回答。當然,以後版本的AYD還會對世界觀知識庫加入學習系統。

整體來說以上就是AYD的基本功能,我預計第一版本的開發週期為半年(實現基本功能),第二版本的開發週期為一年(實現學習系統),第三版本的開發週期也是一年(實現3句上下文有關及對以前版本的一次全面重構,實現更優美的架構)。
2.5年是段漫長的期間,能堅持的人恐怕不多,我也不敢奢求什麼。不過至少有信心堅持半年的朋友,希望能組織起來,讓我們一起為完成全世界最聰明最萌的春萊發動聖戰~~~~

TOP



當前時區 GMT+8, 現在時間是 2023-10-3 17:35

Processed in 0.022924 second(s), 8 queries, Gzip enabled.

清除 Cookies - 聯繫我們 - 中文偽春菜後援會 - Archiver - WAP - TOP - 界面風格