精通世情、道達研理 — 陳繼宇 博士太平紳士 (通達網絡)

創新的科技曾經對我們來說像是遙不可及;人工智能、大數據、智慧城市,說來就像未來世界一樣,但實際上已與我們生活息息相關。無論是網上商店、社交媒體平台、影視分享網站或者討論區;可能是一句說話、一個讚甚至乎一個瀏覽,這些都隱含著不同的大數據,根據這些數據拼湊人工智能的科技從而引發更多新思維、新知識;透過教育我們這些新知識,然後新科技就這樣誕生。我們從應用這些新科技當中又再一次衍生不同的大數據…一直循環不息。

通達網絡(Totaltact)創辨人陳繼宇博士太平紳士(Dr.JasonChan,JP)透過建立一個全面的電子智庫,目的在於整合社會資源、打破知識門檻,以實現教育機會平等。今日就讓我們與陳繼宇博士太平紳士暢談一番。

源起

「剛開始時只想做電子智庫—E-ThinkTank;10年前,那時於智經研究中心任職經理(硏究),統籌了不同的公共政策督導委員會為各個公共政策上給予意見,當中發現雖集合眾多社會精英的意見但是還未夠全面,民間的其他意見會否有遺留呢?怎樣收集這些大數據呢?」最後他決定由他去收集這些數據;從不同的網上平台例如Facebook一些專頁Fan Page上的回應和討論為搜索源頭。有別於傳統做法,不預先設定問題去搜集數據,而是從大圍所收集的數據中找尋特別的關鍵字、樣式、形態、格局和問題,學術界稱為紮根理論——GroundedTheory。「如3月份大眾關注程度只有10%,但若隨著每月遞增至30%,那就知道大眾正在對這事越來越關注,從而尋找當中牽涉其他相關的關聯字,看看會否有其他特別事件將會發生,這部份就是我們想要做的事。」

「不是由ResearchQuestion引導,而是經由民間的數據搜集回來,發掘一些新的、未知的,那就是傳統的ThinkTank也做不到的。」

拆解暗藏數據內的「提示」

收集大堆的數據回來,若不懂得拆解當中的意思,一切也是徒然。陳繼宇博士結合了人工智能的運用,就像一個預先警報的系統;當遇上需作危機處理的情況下,這個便成為一個指標或指引。

「整合這些數據是希望社會更和諧,當你在一些事情未發酵前已經被安撫好了,那就不會製造那麼多的怨氣出來。」

「要留意若是圍爐取暖的效應便會造成不和諧的現像;社交平台如Facebook或Google+是根據用戶的喜好,推送出相關事物給用戶,這正是大數據的原理,希望由很多很多數據中尋找一些少數據去看,方便用戶。不過長遠來說,則會減少大眾接納視野以外的寬容及豁達的態度。」陳繼宇博士表示媒體的報導通常只顯示正反的意見,未必能反映事件的完整性「我們可以將整個畫面早些讓大家了解;由支持到很反對;讚成到很不讚成,中間是有很多不同的意見。我們可以表列出原來中間的意見是有一個三角型這麼高,旁邊只是小數的正反兩極。」

這樣的大數據分析無疑能幫助政府制定政策及應對社會的反應,「我們可以將這分為三方面;首先是預警,其實社會上有些大新聞在發生前早已有預兆,只是未引起傳統傳媒注意。如佔中或者國教前,民間還在討論時,網上媒體還未達到10%,平日1%都沒有。若根據這些指引數據,如1%到5%時候,政府便可預早知道民情狀況作出相應處理。」

「其次是當事件真的發生時,我們可以從網絡上尋找資料,並作出分折加以結合,這些資料對於主辦方或政府是有一個策略作用,他們會知道實體上是否有人操縱言論,背後是否有任何陰謀,我們都可以從中看到線索的。 」

「當天下太平時,公關又可以怎樣做呢?當某人在甲頁面時,同時他在其他頁面都有不同的行動時,這類不同組別模式的行動,便可以歸立哪類人喜歡哪種頁面及興趣,從而可以聯合這些資料,幫助及增進用戶之間共同合作的機會,令大家接觸的層面又增加了。這可鼓勵他們更進一步跨界別處理不同事物,如跨地域,跨知識及跨年齡等。」

網絡隠患浮現,搜集數據分析困難度升

社交平台上每一個行動都是公開性,隨著一般人開始關注自己的私隠是否會被侵犯,無形中影響到用戶的行動及取向。「但其實我們分析時,不會因為單一數據讚好就計算為一個等式,而是計算不同的等式,每個讚好的等級的百分比重都不同;如某用戶在其中一頁面發出一個評論,繼而在一分鐘內於其他六十個頁面發出同樣評論,那是否還會計算為同等份量的發言呢?這些有目的性的事物在傳統教育上或政策研究上,有時只會計算為一個單位,但是在大數據分析中就可更智能化以不同等值來作更多不同關係分析甚至預測。」

因為純粹是大數據,只需知道大圍不同組別模式,不是要追踪某人。

只是經過劍橋分析(Cambridge analytics)事件後,現在要在Facebook搜集這類型數據愈來愈困難;「如果用 Facebook的API 去收集資料是比以前是困難了,每次它給你的資料少了,每日拿的資料亦有限的,亦會有很多不同戶是被檢查的。」陳繼宇博士表示現時唯有突破不用Facebook的API去做收集數據,但由於現時的專頁愈來愈多,要如何釐定搜集多少才足夠反映了民間意見呢?「當然就算只是搜集了幾千個專頁,總比民間普遍的調查好,如一千份問卷,一千五百個意見調查,已經可以從中獲得多幾十倍,甚至幾百倍資訊。難度是加大了,不過我認為都是要從這個渠道繼續下去。」

下一步

「建立電子智庫是通達網絡的第一步,令到人工智能掌握中文的能力更好,從而可以做配對的事;第二步是做學習資源共享的平台,改善以往教科書傳統是一本本的。既然電子音樂平台可以分拆單曲銷售並與唱片公司共存時,那為何電子書就不能有一個平台讓它分拆開來?現時很多學校都喜歡以精英班或輔導班區分,書單亦有些不同,這樣對學生來說不太公平,也做不到因材施教。」陳繼宇博士認為縱使一個精英班的學生,也未必科科都是強項,為何學生不能擁有一個屬於他們自己的「播放列表」,「如果可以像iTunes那樣預付一年的書單費用,然後在平台上他們就可以隨便看多過十本有關同一學習單元的內容的書籍。再以人工智能機器作出配對;即是基於學生的能力和偏好、學習資源內容來配對相應的題目,這樣就能更快滿足到他們的學習需要。」

「從前製作教科書,必須要整本做好才能出版, 然而坊間只有數個作者, 教材質素就受這數位作者影響。 為何不可以人人也是作者? 」

陳繼宇博士希望有更多臥虎藏龍的人也可以出來幫助,甚至是一些剛考完公開考試的學生,也可以在平台上分享他們的學習心得。

論香港創科還望清晰定位

對於香港的創科生態環境是否有利初創發展,陳繼宇博士認為單靠香港未必有利。就如大數據方面,香港只可以提供700萬人的數據供人工智能機器去學習,而此數量根本並不足夠。「如果香港要做創科,要做人工智能語言學習,機器學習的入門根本;如果連這一部分也不能完成,也不能更新智能家居;現時智能家居很多只是靠聲控,但這並不是人工智能,其實只是普通智能,一個對應的模式。若然是人工智能,整幢大廈就會像人一樣,牆身就如人的皮膚一樣,裝了很多感應器,根據人的反應及行動,如感知體温越來越熱就自動加強冷氣機的運行降低溫度,這才是真正進入人工智能的階段,至於機器要怎樣學習才可以進入這一步呢? 香港的市場太細,要尋找大數據,最近的就是內地。」

他認為創新的事物未必發生於先進的國家或者已發展的國家,所以對香港來說做創新會有所難度,「反而在未發展或發展中國家做會容易很多,那就應該要從這發展,人要成功就要看怎為自己定位,若然置於經濟成長中,陪同一起慢慢發展下去,就會較一帆風順,香港要做創新的優厚條件,反而是要借大灣區,可否起了一個帶頭的作用,聯合大灣區幾個城市一些有著專項特長的人一起出去見客,香港就做這個超級聯繫人。」

青少年及初創的機遇

陳繼宇博士認為一個合適的定位與視野對青少年及初創企業尤其重要,若然只局限於某地區,就很難把握到機遇。「地球是圓的,任個一個位置也是中心點,不一定中環或金鐘才是中心點;加上現在科技先進,任何一個處也可以是你的辦公室,那更要找一個位置可以方便接觸到更多可以幫助自己的人。年輕人未有足夠經驗掌握自己獨有的專項,要達致強化,更需要尋找助力;可能來自內地、歐美,更甚至全球各地都可以。但為何要他們要與你合作,也要給予他們看到一個商機先可以。」

「建議青少年或初創要找到自己的賣點及定位,這才可以找到全世界的人與你合作,那你就會贏啦!」