
科大訊飛輪值總裁吳曉如
3月31日下午,在2017全國智慧教育觀摩研討論壇(合肥八中站)上,科大訊飛輪值總裁吳曉如做了題為《人工智能和大數據驅動下的個性化教育》的演講,從教育信息化發展趨勢、人工智能技術對教育發展的推動,以及科大訊飛國際領先的人工智能與大數據技術在教育領域的應用等方面做了精彩分享,引發現場2000多名嘉賓的熱烈反響。以下是演講實錄——
各位領導,各位嘉賓,我再次代表科大訊飛對大家這次相聚在合肥共同探討智慧教育,表示熱烈的歡迎。希望今天在我的報告里,大家能夠了解幾件事情,第一件事情科大訊飛實際上是一個技術型的企業,希望大家能夠了解人工智能是怎么一回事;第二件事情希望通過我今天的介紹,大家能夠了解當前的人工智能技術,能夠為我們解決一些什么樣的問題;第三個方面,人工智能技術正在社會上產生非常深遠的影響,我們可以共同探討一下未來幾年,人工智能技術將為教育帶來怎樣的影響。
首先請大家看一個視頻。“熱烈祝賀2017全國智慧教育觀摩研討論壇在合肥順利召開。祝大家身體健康,生活愉快。”實際上還沒有到新聞聯播的時間,但是為什么能聽到這段新聞聯播,這就是人工智能的魅力。我們用康輝和李瑞英每個人大概一個小時的語音就產生了他們的聲音模型,用這個聲音模型可以合成任何的新聞聯播。所以可以看到,人工智能可以給我們做很多的事情,未來在教育領域也能夠給我們帶來非常大幫助。
NETP和地平線報告
通過今天上午在八中的分享,大家可以看到,關于教育技術該不該使用應該不再是一個需要爭論的問題。去年美國的下一步五年教育技術計劃中,也認為大家不要再對技術是否會對教育產生重大作用而爭論,現在的問題是我們該如何用好這個技術。今天在座的各位之所以來到八中,不僅僅是因為王校長的魅力,因為八中的魅力,更是因為大家對人工智能、互聯網以及信息化技術怎樣改變教育抱有非常大的期望。

現在有兩個非常有名的報告,一個是地平線報告,剛才吳教授已經說過了。另外一個是美國未來五年的教育信息化技術的報告,也說到了技術在教育中的作用。這個報告一共有五點,我們可以先看這四點。
第一個是技術可以讓學習更有趣。今天上午大家可以看到技術給學習帶來了非常大的方便;
第二個,老師應該綜合運用資源數據,將各種相關的技術穿插起來,才能夠給學生提供更好的教學活動;
第三個就是我們如何通過技術把“教、學、評”更好地關聯起來,讓學生在學習以后很快就通過評價,知道自己是不是了解了所學的知識;
最后一點,我們要通過自適應和相關技術,讓學生在學習過程中享受到個性化學習的樂趣。這是現在各種教育研究報告中非常關注的四點。
還有一點說到領導力,今天在座有很多教育局長、校長。關于教育信息化,科大訊飛只是提供一個工具,最后還要看各位校長怎么使用。如何利用工具在一個區域把教育信息化推行下去?怎么證明它有用,從而向上級部門籌集更多款項來推動教育信息化?所以通過今天的溝通,我們可以共同探討如何提升信息化推動者領導力的作用。
教育信息化推廣的關鍵因素
大家都在說教育信息化非常有用,但是現在很多區域還不知道教育信息化怎么做。大部分的教育專家不是信息化的專家,那同樣做信息化技術的人也不是教育專家。所以在一個學;騾^域推行教育信息化建設的時候,怎樣規劃和推進是一個非常困難的事。在過去幾年里面,中國的教育基礎設施建設走的是比較遠的,美國的教育基礎設施建設和中國比不過如此。

還有就是有了一個好的產品,還需要好的運營。我非常認可王校長之前講的觀點,降低門檻,讓更多的老師愿意去用,通過常態化應用發現技術和教育更好地融合的模式,這是最后的產品和運營,今天不在這個報告中說了。
在規劃和推進過程中,首先需要一個總體規劃,即我們教育信息化的目的是什么?王校長在他的報告中闡述了通過互聯網、信息化的技術讓學生更好地享有終身學習的能力。
有了這個規劃之后,老師學生和你想法一樣,一定要這么去用?王校長說的是叫實用,我們覺得是剛需推動,一定要讓老師、學生馬上享受到好處,他們才愿意去用。

我們很難能看清五年以后信息化在教育中的應用情況,怎么讓系統保持無縫的眼睛,讓當前信息化建設的成果不會半途而廢?今年信息化建設成為明年的障礙?這當中非常重要的一件事情就是數據貫通,大家以前可能看到有很多校園網上面密密麻麻排布了很多應用,看似用一個外部網頁把這些應用都集成在學校的網頁里,但是底層都不相通。
底層相通最重要的是三個相通:第一個是用戶相通,用戶通過一次登陸,在各種應用上都能無縫轉移;第二個是數據相通,無論是在哪個環境下形成的數據,底層都是通的;第三個是資源相通。
有了數據貫通以后,管理者就知道當前教育信息化建設推進的進度和效果,這種推進不是到一個點、一個班級、一個學校去看它,而是通過一個數據報表告訴他信息化建設推進的某一項成果怎么樣,中間有哪些問題,應該怎樣去改進。前面幾條說明應用是一個深化的過程,但是只要做好數據貫通,只要有一致的目標,這條路就可以源源不斷地往下走。
關于總體規劃,我們非常高興地看到央教館牽頭做了一個區域教育信息化建設的指南,這個指南包含學界、工業界在一起。這個指南的初稿已經出來了,訊飛也參與其中。它參考了合肥市一些優秀區域的信息化建設的狀況,對未來學;騾^域教育信息化的規劃有很強的指引作用。
這其中有幾個核心,第一個是要覆蓋“教學考評管”這些比較關鍵的環節。第二個是系統之間比如底層的數據要互聯互通,第三個是最終要實行數據支撐下的自適應的教和個性化的學。

我們剛才講到剛需的驅動,是要直接幫助老師幫助學生。到了中學以后,老師、學生的時間都非常緊張,我們所有的東西都是圍繞著時間來的。
第一是減少老師重復評閱的時間。一個老師原來評閱學生的作業試卷,一天需要一個小時,使用相關的技術后只需要40分鐘,另外的20分鐘可以更好地和學生去溝通,考慮如何提高學生綜合能力的培養。
第二個是減少學生重復訓練的時間。當然減少這個時間以后,我們主張學生到操場去多跑跑步,去實驗室做一些動手能力的訓練,這個是下一步我們值得思考的事情。
第三個提高課堂的效率。傳統的課堂教學場景是老師說學生聽,兩者行動一致,班上50個學生的學習的場景都是一致的。但是今天上午大家看到,通過數據驅動的自適應學習,課堂的效率有了大幅度的提升,這個是剛需驅動。
剛才已經講過的數據互聯互通有哪幾個關鍵環節。第一個環節,數據的互聯互通要以學生和老師為核心。學生在線下學習的數據也能到線上為我們所用,老師在課前備課的數據能夠在課堂所用,所有的數據首先形成是以最關鍵的角色——學生和老師為中心的。

第二個方面就是數據要形成以班級、學校為單位的數據,一個區域的數據必須是由班級、學校一點點地匯聚,形成最終的數據庫。所以數據的互聯互通非常重要。
第三個就是數據支撐的應用監測。一個班主任原來只能了解他班上最好的和最差的幾個學生,從今天的觀摩課中我們可以看到,未來老師可以掌握到全班學生全景學習情況的視圖。對于校長也是一樣,他可以通過數據了解整個學校教研工作推進的情況、信息化設備使用的情況、整體教學中的關鍵薄弱點。對我們區域也是同樣的,如何推動區域教育協同化的發展,除了過去傳統的一些通過會議、現場某一些點的調研繼續需要之外,還有關鍵要通過數據背后的支撐。
最后的建設,第一要避免用戶數據的碎片化,剛才已經說過了,第二要避免應用場景的割裂化。不能一個IT系統就僅用于給老師課前備課,另外一個IT系統只用來給老師上課。系統的建設不能盲目,我們要根據當前系統應用的成果是否解決了老師和學生的剛需,未來是否有更大的潛力。因為信息化建設是一個非常寬泛的領域,我們要尋找到對我們幫助最大、剛性的線路切入進去,第一個方面就是剛需切入、無縫衍進、數據驅動,這也是人工智能里面比較關鍵的。因為人工智能就是通過數據訓練找到一種最好的模式,把原來需要必須有人做的事情由機器來做,所以我們想剛需切入、無縫衍進,在一個總體規劃的布局下,通過數據驅動的形式不斷推動應用的深化。
教育AI時代已經來臨

去年一年,似乎好像人工智能突然就走到了我們的身邊,谷歌做了一個非常有意思的比賽,就是圍棋比賽AlphaGo戰勝了圍棋冠軍。李世石的水平在一年中不會有太大的變化,但是機器的水平還在不斷的提高,現在人類是沒有可能再去戰勝機器的圍棋水平。只要數據足夠,人工智能就會越來越好。人工智能僅僅下圍棋對我們沒有什么太多的意義,它以后能夠解決很多事情。MIT和麥肯錫分別有一個報告,都是說差不多到2035年會有45%的工作被機器替代掉。
從2016年來看,這個趨勢已經非常的明顯,比如現在有很多電話接線已經不是人在后面接線了。中國聯通和中國移動每十個客服里,就有2到3個是我們的產品來替代,F在很多法院,比如江蘇、廣東的一些法院書記員已經用機器在做。我們的老師要考慮一下,工作過程中哪些活動將在很短的時間內就會被機器替代掉,哪些活動是機器可以幫助我們老師做的更好。我覺得這是今天非常值得去探討的一個問題。
人工智能技術現在受到非常高的關注,美國最主流的媒體紐約時報做了一個報道,是中美人工智能的競賽?拼笥嶏w作為國內唯一一個企業有幸被提到,他們說讓美國的科技界不要太驕傲,中美在人工智能領域角力,中國差距并不是那么大。這么說是因為訊飛有幸在去年最重要的三項比賽,包括NIST美國國家標準技術研究院組織的語音識別比賽、暴風雪語音合成比賽、推理比賽中都是第一。這也為我們下一步在整個教育行業的技術應用提供一個非常好的支撐。
克強總理也在今年人大會議上正式提出了,人工智能是下一步重大新興產業的一個重要方向。大家有沒有注意到今年總理作政府工作報告時,屏幕下面出現的字幕是怎么產生的?就跟我今天說話一樣,是由我們把總理的講話實時轉成字幕,顯示在這個屏幕上,這樣可以讓更多不方便聽的人,比如說在大廳里,比如是聾啞人,都可以很好的去看到政府工作的報告。
人工智能對教育的影響
人工智能技術到底對我們教育當前和未來要產生什么影響?我覺得主要有幾個方面。
1.人工智能自動的叫數據結構化的技術,可以把當前采集的數據編進計算機進行分析。比如學生所做的試卷、作業,這是課前和課后銜接的一個重要環節。以前作業做完就結束了,現在機器可以把做完的作業編成計算機可以處理、分析的數據。
2.可以讓優秀經驗模式化,F在科大訊飛的人工智能技術可以批閱越來越多的中英文作文題,以后還可以批閱更多領域的題目。未來機器還可以把更多優秀的活動變成一種模型讓計算機去運行,從而代替很多繁瑣的工作。
3.數據驅動的個性化的教學資源。這個在上午的觀摩課中已經看到。最后,我們希望每個老師都有一個教學助手,老師只有一雙眼睛,一雙耳朵,但是機器可以變成千里眼幫老師觀察每一個學生。每個學生都有一個機器學習伴侶,可以幫助學生整理學習筆記、發現學習中的問題,幫助學生更有效率地學習。這個機器已經開始做,而且在未來幾年中可以做得更好,關鍵就是數據。所有的教育專家們一定要關注教育的數據,因為有兩種數據不可再生,也是別人不可給你期待的,一種就是醫療數據,只有你自己的身體產生,還有一個就是學生學習的數據,只有這個學生的學習是個性化的。
幾個關鍵應用我們也拋磚引玉地提出一下。第一個是優質教學資源的結構化。以前我們錄播課,但是錄了那么多課,有幾堂課能被后面的學生所用?我們現在講微課,就是把直播課里面關鍵的一些小的優秀片段找出來,F在有了最新的技術就不用去找微視頻,因為已經把老師講課的視頻切成了一段一段,而且每一段對應文字檢索,學生回去如果想去檢索這個老師上課的關鍵視頻,他可以很快可以拿得到。

第二個是全時互動以學定教。技術要創建線上線下的環境,應該讓老師和學生以及學生和學生之間、學校的管理者和老師學生之間可以全時互動,跨時空互動。好處是可以準確及時地發現教學的問題、學生知識掌握的問題,通過以學定教來調整我們課堂的效率。

第三個方面是聽說訓練無障礙。廣東省的高考口語和江蘇省的中考口語,這兩個都是全省性考試。訊飛提供后臺技術支撐,所有口語數據都是由機器來評測,F在北京、上海也在推動。

第四個是虛擬現實或者增強現實對教學的支撐。學生在一些需要發揮想象的課程中,形成想象思維能力過程需要時間。今天在八中展示了一個VR實驗室,有了虛擬現實以后,學生可以非常好地去理解原來很難想象的知識點。

第五個就是個性化教學。有了大量學習的數據以后,系統可以對學生進行問題診斷,最后給學生推送個性化的學習資源?拼笥嶏w之前與北師大在協同創新項目中進行了合作,今年我們和北師大共建了國家教育大數據的國家工程實驗室,下一步我們也希望有更多的專家為我們這個工程實驗室提供素材。

第六是主觀題的評測,F在英文中文的作文題已經可以評測,而且評測的分數一定比現場老師評測的準確,這個經過多次的實驗得到驗證。我們和教育部在去年的3月份攻堅了一個聯合實驗室,現在四六級考試中的英文作文已經開始用這個技術一人一機來評了。它不僅僅減少了老師的負擔,更重要的是帶來了數據。大家可能會問老師不評閱作業怎么了解學生?這個技術剛好做了這兩種銜接,老師每次還要評閱一部分,用這一部分數據去訓練一個老師的模型,再評閱其他的,老師以后只需要評閱20%的主觀題。

第七個關于高考的分層排課。3+3以后課表怎么能夠排的更好?解決方案基本已經有了。我們通過整個智能的搜索算法,就是把學校的老師的資源、教室的資源、學生數目、學生的興趣全部輸入機器進行決策,然后給學校一個輔助的排課表,最后由專家進行調整。這樣可以大幅度降低排課的復雜度,提升學生的資源的滿足度,這個在很多地區已經開始使用,以后對我們整個教學的管理可以起到非常好的幫助作用。

訊飛教育產品應用情況
剛才講了幾個場景,最后我們再簡單列舉三個融合性的應用,說明我們的場景的應用不應該是割裂的,應該是打穿的,應該是使線下和線上的行為,課堂和課前課后的行為融合起來。
第一個,學生回家和課堂教學的場景怎么有效融合起來,雖然紙筆作答,但是一個學校只需要一臺掃描儀就可以把紙筆作答的內容變成最后老師可以分析的數據,F在紙筆的數據被機器所識別的準確度可以做到97~98%以上。

學生也不見得一定要在紙筆上進行答卷,我們也有一個系統,這個本子是特殊定制的,加一張紙上去就可以在上面寫字,寫完以后就可以看到寫的結果。寫完以后,這個本子就可以把你寫的內容傳到手機,作為一個文檔所保留下來。以后班上每個同學都可以有這么一塊板,回家后說一個知識點沒聽懂,老師拿著這個板,一公里以外的學生在家里面拿著電腦和手機,可以實時看到老師的解答結果。這個產品在4月份會正式推出,和今天上午的智慧課堂可以形成一體。

第二個融合性應用是優質教學資源的PGC。很長時間以來很多資源是出版社提供的,我們認為最優秀的資源是名師在教學活動中產生的。它是一個自然而然的過程,比如說老師發現了學生一個關鍵知識點掌握的缺陷,在課堂上就可以實時地講解一個微視頻錄播,錄播完了以后通過語音識別,把它結構化推送到班級圈里面形成校本的資源,所有的學生回去以后都可以非常方便地來調用這些資源,這些資源在日積月累的過程中越來越多。而且哪些資源被學生調用的多,他就成為了真正的精品資源。所以說以后資源的產生和使用是一體化的,這種資源的產生和后臺學生的使用是通過數據貫穿在一起,是一種融合性的應用。

最后我們再看一下大數據驅動的教學和教研,目前我們還正在探索,這個方向非常有潛力。我們對一個學校的兩個班做了分析,發現這兩個班學生的學習成績差不多,但是通過后臺看到其中一個班級學生所提交的各種文字材料,發現這個班學生負面情緒非常多,大部分比較焦慮,在作業上花的時間也很多,但另外一個班級就不是這樣的。針對這個狀況,我們探究學生壓力是如何產生的,兩個班的差別在哪里?未來通過后臺的數據可以提供很多這方面的一些指導。

科大訊飛目前的產品很多覆蓋到了教學考評管上面,但是因為教育非常的的復雜,我們的應用現在才走出了第一步。希望和在座的教育專家一起更深層次推動教學的融合。我們也很希望在人工智能時代,通過大數據和人工智能,可以推動教育不斷走向因材施教,走向個性化教學,能夠助力我們中國教育更快地發展。謝謝大家!