我們其實衛生電子那衛生電子其實在台灣我們也是個上市公司那我們其實從我們已經到現在已經也二三四年的一個資歷在IT這一塊那我們主要是做CPU還有金電子那這個過程裡面其實我們也開始往AI的方向進來這樣子那剛好我們最近其實看到很多的應用比如說我剛好有一些同學在台大那像他們在那個他們管東明那個校長在演講的時候其實那些聽障的一些同學其實他們是看不見所以他們就聽不見所以他們必須要有一些手語那我們就在發想說其實手語當然很好但是其實如果有其他的一些更及時的資源會更好所以我們就在想說我們既然有做一些語音辨識的東西那現在這種及時之目的應用其實一直都看到比如說現在我們順時中部長的這種及時的這種手藝其實是很重要的那如果我們可以把它變成一個及時之目我覺得其實是可以幫助很多人這樣子所以我們就看到很多很多的應用產域有這個東西那但是因為對我們來講其實我們是台灣本土的廠商我們相對的資源或什麼也沒有辦法去跟這些劇破去比所以我們也是希望說看有沒有機會把我們的產品介紹給我也一下那因為剛才你也講那其實我們也希望說一些台灣的手足群能夠有機會在很多廠商裡面來發揮所以今天其實我們目的是想要把我們的產品介紹給委員也跟指導一下告訴我們說哪個方向我們可以繼續往那邊發揮主要是就開始對 是那這邊是我們的專頁那基本上我們衛生館我說過我們也是一個上市公司那我們的RBC到2000人也握萬然後然後我其實我跟彭志宇說我最常講的是最下面這個我們有帶六星的專頁代表我們也滿深耕在技術之一那我們的老闆就是王雪蓉跟鄭文綺他們這樣子對好 那下一頁那其實我們整個集團的公司其實除了我們衛生之外其實我們還有做那個USB3就是現在威風電子也總列在開始要做那個新櫃 叫做IPO那除了這個之外其實HBC也是我們的兄弟 系數同盟然後我們這邊其實現在目前除了做一些切入式的應用那CPU啊 鍵鍵組還是有之外我們現在做很多AI的部分包含工業4.0還有一些車用的ADAS的一些應用那當然還有5.4所以大概是這樣子好繼續往下那就請彭經理介紹一下我們的Odami好 這邊就來這邊是一個起源大家理解可能就從公司這邊有沒有看到我們這邊也有舉行一個T-Shop實驗室在做一個公式的資訊機後來看到那個字我們後來就覺得我們有一些經驗他們也在做這一方面的東西所以可以跟我是幫他們宣傳嗎公司是不獨立的所以我們不會正式指導他但是對我是有幫他們宣傳沒錯那我後來因為我們也有做這一方面的東西也介紹不一樣的做法好那第一個部分我想像我已經介紹的是說我們Odami除了當然主要是要講字幕當然在講字幕之前我們可能要為原先介紹一下我們大家在講明辨式可能先入為屬就會覺得說就是做音箱但是我們其實做了非常多的體驗就是這個樣子我們最主要是想把明辨式做到融入的一個融入我們的應用上面會在很多應用上融入好那第二部分就是正式來講講明辨式的部分字幕界的部分第三個部分可能就是我們比較擅長的部分就是說我們怎麼樣去做識別的強化可能好那所以我想稍微補充一下那個融入式的產品其實像我這邊我們也滿看好一些在醫療部分的那我舉個例子像現在反應期間大家其實都很不想去touch一些東西所以像我們在醫院的時候其實接觸傳染是一個很大的一個病人傳染所以我們用語音的時候就會變得非常的符合這個人性而且也是做到防疫像現在大家都對他按電梯那如果電梯去講真的融入講的那其實也是一個滿好的一個重點現在大家都看誰去按電梯你按到我就不按了看很多觸碰的螢幕你手套沒辦法用在你戴口罩當然還是可以用對 沒錯 沒錯是 沒錯那第一個步驟我就講說我拉尼這邊做出式的理念用的介紹也就是SK人設計的部分那這邊很簡單的先講說在其實語音辨識大概就會包含幾個比較重要的技術一個是喚醒者的技術那一個是ASR的技術以及自然語音分析的技術大概後面還有SK那個語音合成TDS的部分那大概部分我們就會先把這種部分光是說喚醒的部分我們就可以用一些就可以把它拆出非常多的音量甚至我們就是因為喚醒者的部分講一句話就變適了那這部分呢像這邊我們在病床卡上我們也有病床卡上面就是我們衛生電子有做一個病床卡那是希望說在病床的後面有一個病例卡病例卡我們可能講了一些關鍵詞之後我們就會有相對的工作體育控制電燈再只能夠呼叫護理帳號這個我補充一下剛好我們在這個場域裡面就是我們就聽到一個聲音很好玩就是現在很在乎這種那種養生村阿公媽媽其實他比較沒有人陪伴的時候那很怕他在家裡跌倒因為跌倒是一個很重要的意義然後我們在這個場域裡面就聽到一種聲音是說對啊跌倒那你就去按那個緊急按鈕可是阿公媽媽都跌倒了他怎麼按那個緊急按鈕所以其實我們也是覺得說在語音這一塊我們就可以來做一點簡單的但是我們就是變成說一個關鍵字那其實就可以讓一些人員來做事實的協助所以這一塊我覺得是蠻好的營養分享給委員們我相信也知道其實語音這一塊我真的覺得有很多可以發揮的地方這樣子那我開始的部分呢就我們單因為他辦公室好處是離線好離線那就不需要說他背後的資料就不必在我路上所以單獨就可以使用那後面ESR部分呢我們就有應用就是說我們可以做到自動機就等一下我們就稍微那另外就是做輸入法甚至說電話客服的公司另外醫師教練幫他系統後面呢也有個朗尼培根系統特別提到朗尼培根系統這個是我們做給一個我們也有一個協議場我們也有一個應該說是我們老闆的一個公司叫做多普達他其實提供台北市有很多小學生的朗尼讀語量大家講的那個網頁叫人MODE好MODE是MODE哪一個好這個都因為小學我建議說小學生的現在的人的口語能力不好口語能不好希望能夠多增加朗讀的作業可是老師出一個朗讀作業呢如果一個學生有三個同朗讀作業那班上三十個老師就要花九十分鐘去改這個作業但是如果能夠變成文字的話學生的老師去改這個作業會非常快老師比較敢出朗讀作業所以就有這樣的意料所以這邊我再補充一個我還有一個間諜因為現在我們在做AI其實以詩全是非常重要的一件事情我們剛才彭金里有提到說其實我們是想要做AGE這樣的意思是說因為我們現在很多大廠它本身都是網民團區其實上次有一個很好玩的事就是你看到的比較的小孩代表很多不管是影音或是聲音或影像都有可能會有影詩全的部分所以我們這邊也強調是說我們有些AGEAGE的意思是說我們的資料是保留在你的Local我們不用到影端當然這個部分也是可以跟現在國外一些大廠來做驅動所以我覺得是我們其中一個強效是我們會掃破一些AGE的部分這樣子補充一下那另外就是說我們有做一些NLP的部分我們就可以做網站DT或者Keepall的部分我們有自己的NLP那換影子加ASL的部分我們可以我們有做停車場的車號查詢就是說你車子挺好的聽進去之後可能用Caml視頻的車大家要領車的時候一樣就是你要用手續輸入號碼但是你可以用一定的方式去做查號找到你的車然後準備付錢的動作那如果我們製作ASL加NLP的部分我們可以做一些問答行整情問答的動作然後就是這部分就是過世以後可以做智慧自動翻牌機這部分我們可以做到你先做到兩百題到一千題的對答就離線的部分就可以做兩百題到一千題的對答動作那後面就是如果換影子加ASL加自然語言我們可以做一生看成記錄的查詢或是整件記錄的查詢大概是這樣那後面就是字幕機的應用那我們接著常看到一些證片發表會或是記者會或是記像報或是一些課程有時候有些部分常會有一些重大的議題的時候會有手藝的名字手藝的名字在旁邊做做頭部手藝的動作那我們就看到這種機會所以我們有一個語音字幕機語音字幕機大概就會把聲音收進來之後送到我們歐拉密的設計變成文字之後我們可以輸出一個或者是直接歐拉密的字幕的solution大概有這三類就是字幕機音母和同一字幕或是字幕那其實字幕的部分大概是你講話之後字馬上出來當然所謂即時其實大概也是有兩秒鐘左右的時間因為聲音要送到雲端雲端就會文字體回來就在後面上這通常存在於哪一種是應用產品的可能是觀眾這跟演講者處於通的場域的時候就需要使用即時字幕那同步字幕呢就是說因為我可能另外說反正他直播直播字幕直播的時候呢因為觀眾和演講者不是處於通的場域也許我有機會透過直播的過程之中有一些延遲畫面延遲之後就可以做非常多事情比如字的修正或者是減少減少那個字和講話者之間的延遲或者是適當的斷膛或者是你再講一個字之後我把整句都修出來這樣就非常類似於大家習慣看到的字幕的樣式所以有這樣的 solution另外後面的字幕當然就是我們既然做完這件事情之後我們可以存SRT檔SRT檔最後我們用播放的方式把SRT檔跟卡拉提的畫面結合在一起最後可以用Zedio Mixer的方式螢幕在一起那第一個部分要介紹就是機式字幕的部分機式字幕這邊就是聲音進來之後我們可以透過我們的我們麥克風把聲音送到雲端的娜麗斯爾這邊之後產生文字之後再跟我們的字幕集結合之後就可以看到在畫面上有字幕跑出來那這部分我們就做一個一個小小的演示那我這邊用的是一個一個台大館校長演講的一個畫面不能抽換成別的嗎不能我現在講一段嗎可以啊可以啊可以啊可以啊我也真的是高手可以啊那我就機式字幕就這樣我們先把它寄到這個雲端書這個下面麥克風是用好 它都做的還不錯這樣大概95吧92到92那我就播一段就是說其實大家講話可能不會說像那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽其實大家講話可能不會說像雲端這樣子這種速度或者是這麽講話這麽技術那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽那麽再丟到也許是藍化也許是一個Bucalogy的畫面那影像部分呢它是丟到Vidio BufferVidio Buffer通常在Vidio Mixer這邊會有一個Vidio Buffer也許可能在1萬個Friend左右或是可以是更大的Friend1萬個Friend可能就有100多秒的時間那兩個畫面重疊之後我們就一樣可以看到在同步的一個資訊的畫面那它流程就是說我們在錄影製作這邊可以直接取得麥克風的資料然後讓一識別之後呢那做適當的短劇和校隊校隊之後呢最後可以拍出這個字幕所以我們在釣在識別之後呢跟拍出字幕的分別要兩個釣不同的人因為一個人識別去修正校隊是錄影製的時間拍出字幕是播放出去的那個時間所以它的實驅圖大概會這樣也許在錄影製送以外時間就0秒但是播放出去之後可能真情況後面也只30秒那後面我們再來看一下後面資訊能怎樣做的如果有些準備要請教一下就說我只在演譬如說我們在看時重部長在講的時候那些手語人員雖然我沒有真的懂手語但是我相信手語能夠表達不可能是時重部長講的所有東西就大致的意思就跟我們同步口意識一樣的道理就是你要傳遞它的訊息本身它有一些修飾的詞所以我的意思是像這種情境下即使是沒有斷字沒有這些分隔相信在實際的應用上還是有它的主要是斷句就是說沒有動畫當然還好主要是說像我剛剛是一整串連起來大概就比較困難所以句號還是要有道號有沒有當然是確實如你所想的不一定是需要道號不過剛剛是句號也沒有的狀況如果有適當的停頓是就我剛剛停了太斷沒有道有句號的程度謝謝但是這個句號是停頓上的句號所以語意上的就是要跑這個編輯前面那我這底下大概就會說這邊會有分詞的結果當然是跑出自出的一點分詞的結果我們電視到一定穩定的狀態因為後面會靠原模型句說不停的做修字就到穩定的差不多之後大家就往上走在上面就看到是文字的部分上去上去上面一直在修正當中你也不希望說不去修正因為等一下又被我改革那現在播放的部分就是氣上修的一個實際的播放把我的狀況我做法我做法是等一下編好的方式是說我在聲音播出來之後稍等一下你現在聲音應該是做HDM比較比較遠的模型就比較難因為持續受到東北風影響在精神之前在北部以及東半部尤其是宜蘭地區也有一些比較局部靈性的這個降雨不過白天之後整個水氣都是比較少的雖然雲層還是比較多那另外中南部都是以多元刀琴的天氣為主大家比較關注的就是在菲律賓東方的這個熱帶性比起目前距離台灣的位置大概是在東南東方1000公里左右的這個海列上未來持續會朝著巴士海峽以及菲律賓北端的這個女送島移動對台灣的天氣預計會在這個週末水氣稍稍比較增多明天的天氣會從北風的影響之下所以在迎風面的北部跟東半部雲量還是比較多一些但是水氣的部分是比較少的以靈性降雨為主中南部大致上是以多元刀琴的我們剛說到降雨97 98我們的做法大概就是說在這邊的時候大家如果很清楚可以點一下這個聲音不過就沒有網安今天持續受到東半風影響在清晨之前這邊講什麼尤其是宜蘭地區也有一些比較具不靈性的降雨不過白天之後整個水氣都是比較少的雖然雲城還是比較多另外中南部都是以多元刀琴的天氣這邊就可以跟綠色色星來做一些相關雙星就可以蓋在清晨之前中南部就在那也許然後這個Send是去Send那Send我這邊可以做一個我是上不太懂那我這邊應該本來編輯的話我應該可能在我這邊的話做編輯編輯之後我會送到一個我會送到一個卡冷器的好來講就說他必須用自己的輸入法了他就是沒有把第二第三候選詞用選的方式OK我可以這邊把他送到一個卡冷器我會來解釋我會來解釋那送完之後呢我這邊也可以我在這個畫面上我可以把他存下來把他把那個Safe Stop待到可以把他存下來存下來之後呢可以把他關掉我們就可以在我們就會跑出SRTSRT檔的時候可以再把這個畫面把SRT洋落進來因為雖然SRT洋可以直接載入到螢幕上面直接跟影片結合但是可能會畫面整個感覺就不一樣了所以我們可以用這個圖畫面就會做到一致那這個呢我們之前這樣比較簡單的大概就我們這邊畫面延遲呢這樣之前公視那邊因為他們必須修飾我們大概看到他大概有20秒左右的延遲並且他當然他中國人修飾他都沒有錯字而且他斷了也有適當的斷法但是因為他跟不上你的嘴巴那這樣會讓大家感覺上錯你可能就沒有辦法再去看字幕了因為他這個時間差太長20秒左右但是如果你的字幕大概2秒鐘因為人家看字幕模擬看到字之後去尋找他聽到聲音之後尋找他一致所以這是2秒鐘左右的延遲是可以接受的雖然沒有很好但是雖然我們這邊做字幕但是也沒有適當的斷法但是體驗上面是覺得很接受的但同步字幕的部分我們經過在播放之前的適當的延遲之後也許實在是2到1分鐘的延遲之後我們可以像畫面的字是沒有延遲的但是錯字也可以經過修正也沒有斷法的問題體驗上當然是比較好的一個體驗當然就是修正那個人打字要夠快是我再也想說如果這個人打字不夠快修正的部分也能讓兩個三個人平行在做因為這是單集的單分那你的選字引擎的剛剛講的第二、第三候選詞是執行你的前段還沒寫好還是說其實他後段現在也不能給這個諮詢就是我如果現在想弄成一個小書發那種選字我們後段也沒給這個諮詢但是我們可以在這裡真的需要打字很快的人我們也可以在語言模型打字因為語言模型到時候也是很多字去挑一個記憶最高好,謝謝我們在介面上是什麼那後面的部分大家就是要講說我們在怎麼樣去強化這個辨識的部分因為歐拉密這部分其實在之前大家都非常覺得說東西語料越多越好所以我們在看到很多人都豪稱說八千小時、一萬兩千小時對啊,你沒有去那個科技大雷台嗎我沒有參加我們沒有看到那些是傳說中的那些語料大概三百多小時現在都可以放資料可是那邊也有提到說不能商用所以我們沒有現在我們授權不了可以商用因為大家都覺得資料越多越好但是後來我們在資料語言是在建立的過程中發現說資料如果你資料裡面的錯誤量跟資料量一起增加反而使得說正確的資料越多越好但是可能常常在增加資料過程中增加的錯誤或是說這資料並不能夠解決真正面對的問題好,所以我們這邊就建立我們有一個機制直接去帶一個語料進來之後我們先經過pre-test的時候找到這個是真的是能夠真的需要訓練的第一個部分我們做scoring的意思是說我們每一個語料就是做適當的評分評分當然其中最重要就是辨識率的評分我們不是要找最高的最高的其實一份語料在我們手上一個小時語料所以這部分花的能力非常多但是我評分就非常快因為辨識率的評分非常快就知道說太高分不能用因為太高分基本都可以辨識為什麼就不需要花的能力去訓練這個人可能他的聲音也許這小朋友他根本念這個客文那麼是沒有辦法沒有辦法正確的念出這些東西出來所以那也不是我們收集對象反而是可能70-90分之一是我們需要收集的對象收集到這資料之後我們就會對著找出真的需要訓練的部分等一下訓練就進歸pre-test能力去檢查根本念錯了所以我們也不能不必訓練那些東西所以經過他跳出來之後通常真的訓練可能只有10%左右所以換句話說我們用人力去跳出真的需要訓練的10%那資料分類有些資料分類是說這部分是因為你的音質這部分是因為中音參展中台參展我們把這個資料分類之後用不同的工具去做訓練譬如我們政治權力在解決的連音質的部分那另外就是說問題去找這些問題很多時候經過訓練之後還是沒有辦法去辨識我們就有一些就是因為經驗的累積去找為什麼我明明訓練過了而且訓練兩次三次都沒有辦法去辨識我們去把這些特別去找後來找或也許就用這種方式去把問題一個一個的解決那後面部分就是我們要把我們資料庫一直都在去找訓練發現說這些類的資料我們在標數的過程中標數錯誤長期所有東西都標數錯誤所以我們會去把這種錯誤的全部在整理一邊讓這資料越乾淨越乾淨越好就使資料是非常多分我們都透過這種流程一次一次的做非常循環所以即時是400小時還能夠上用現在對你的編輯效用如果我拿來用我可能會找出10%了解因為這些東西大部分都可以辨識我舉一個例子即使我們剛剛看到這麼好的辨識率那我們實際上拿一個電視節目來試那你聽到這電影實在是一樣的我是趙少康你來到TVBS邵康戰局你覺得非常不合理非常不合理你看看不懂這些資料就不出一個但是經過這樣的訓練做一些一次的訓練一次的訓練之後就已經可以變成說一眼看上去那為什麼會有些資位這麼難訓因為可能大家考慮的關係你可能對尤其是這專業的廣播人他在講話的時候他可能會對人民對一些數字非常的清楚可是他對於中間常常在講的話他覺得他就很快速的待過那麼快速的待過他也不是非常清楚的講其實都非常難辨識你也不是每個字都有意義的你也不是每個字都需要聽懂在語音辨識其實對這些註詞或是對詞是非常沒辦法處理的但是經過這樣的訓練至少能夠變成一篇文章是能夠比較看得懂的大概是比較有問題那這個是這個數字比較小大概就是說我們做過剛剛的這樣訓練之後我們這邊我們這個我們並不是跟他那我們是用正確的百分之百辨識的句子多少我們這個訓練單位都是句子句子大概是10個字到20個字左右的一個句子那如果要在字幕上呈現很在意的是說錯幾個字大概錯超過如果是錯超過80%這個句子就幾乎沒辦法在畫面上處理因為百分之百辨識的在90%的代表能夠我們可能在80%之前都算一億的因為在畫面出來都看得懂所以我們用這種方式來評估我們經過這樣一次一次訓練之後如果是我們開始即使一般讀稿能夠有很高的辨識率但是他經過我們特別挑出來的特別挑出來一些像這個是一個電視節目的語音發現說在一開始只有非常低的1%左右那經過這樣的訓練之後後面我們一次一次的做了之後後面可以做到百分之五這是針對教授他這個人對於我們所以當你有多人的時候你怎麼樣你做與者識別然後他不同的那種上去其實我們這樣在做的時候另外一個觀察點會不會影響到整體的東西事實上我每次在做這種訓練都是緩步的在上升Geno的語音要是緩步上升但是我對我訓練的方式的cutting卻有很明顯的提升這是我希望看到的既然我不能影響到Geno的效果但是我對我的target能夠跟我的target go domain能夠有很明顯的上升那這樣做到後面其實他如果突然反而是80之前幾乎都有興致有90%90%以上的變適率如果你用80%就是很狗的話那換句話說他打在字幕上幾乎看得懂不需要挑這個幾乎看得懂那後面也介紹說我們花了那麼多時間在做電話語音的部分我之前不夠一個dupress其實我們的目標就是做這個類似色的語音那後面就是台式中文這邊說不講那你像TVBS就沒辦法但是我可以訓練他但是因為他我們沒有特別訓練或是說因為TVBS他來討論的東西我說這四個字他有四個英文嗎這四個字其實是一個專有名字所以你論上你放進去是可以訓練的以中文字為訓所以比較難放這種也許四個英文字進去當一個訓練的那個詞啦但是這個當然也該做配合就是太大問題了因為現在我們的董事長就是TVBS董事長所以TVBS四個字認不得這個可能有一些後果我覺得HTC三個字認不得沒錯其實這種中英文混字這個狀況其實就是說你只要放進語言模型我們聲音有收集不然你語言模型因為你這次幾乎都會出現我剛剛並不是在講英文字我只是講英文字母字母是最好放的但是其實我們平常如果以中文為主的話我們並不會加在整個英文字但是縮寫的話我們就說NCOVC-O-V-I-D十九那這個時候C-O-V-I-D就有五個字理論上跟中文字應該要一樣好別人在對我覺得這個還是有必要的我的經驗是這樣的單一字母的語言可是我這邊訓練三個字要合在一起當然不能說B的訓練M有訓練當然我的一順你還是把它看成中文一樣它就是一個TRIGRAM其實你即使用全型的英文字把它當成中文字訓練還是可以找得去另外就是說我們對血統的聲音是我們特別抗度的那胎兒的部分特別是可能只有我們在做你公園其實也有一個可以跟你做但好像比較沒有上傳還有裡面有做合成嗎沒有我有認識另外一家叫異傳他還有做合成但也有做音樂練習那另外就是比較有客製的話就剛透過那流程可以讓某個情景某個Domain能夠變化不好另外就是系統運用的部分因為我們這種運用辨識放在系統當中不懂得使用性配合但是那來介紹大部分是這樣子那我再介紹一個播給影片的時候我最前面有放這樣子台語這是一次我們在教育訓練他都沒有跟我們講即使就換電上去因為台語贏掉比較多理論上是正確的贏掉比較好你可以用的就是同音字理論上比較少但是當然這樣講的人很自然強遠可是我們在台語這邊遇到的難題也是說他的市場太小變成說我們很想多投入可是台語的加一點所以我們現在也是遇到這種狀況但你如果要做你剛剛講的醫療用途的話這個還是得碰因為很多長輩尤其你強調的時候你要他跟講自然強遠的不可能所以其實在這一次其實我們在這個剛才講的裡面有一個我們在做醫療的那因為有些時候就像我自己有時候我去看電影我真的等兩個小時只看兩分鐘那過程裡面其實很多的事情應該在整前解決我們其實現在也是想要有跟音樂在那邊做這一塊在前面就跟阿公阿媽那我們就知道他所有的狀況那進去就直接單刀之類不用在乎那些事情為了時間我在可以看一下當然我們最近電網是非常簡單的168公分16公斤1980年6月6號大概就說不好意思這個大概就說我們在這邊可以做完全理解這個系統只是一個網頁而已其實這是一個super nice的畫面其實所有的辨識可能都在這邊小心擺裡面其實我們覺得明明辨識也許有一個表情一個卡通的表情體驗那不應該出現這是super nice的畫面所有的運算都在這裡他大概可以做200到1000劇左右甚至一個也許在醫院的一些像是整前需要做的一些判斷看一下看你的勢力或是說做一些什麼狂判的一些判斷那些圖片都可以用這種方式來做其實在醫院的場域裡面遇到的就很好有些醫療師在偏鄉其實他沒網路他沒網路他一定反而是要一些Edge所以這邊其實我們也是覺得說這是我們本土廠商的一個機會OK這只是在運用的部分你training的話Edge有trained回來應該可以data收回來然後馬手再勸更還是publish model我不是所謂federated這個就比較困難這相對不難因為現在的Edge要真的做到那些全贏的東西可能做infance就可以做到全贏有他的難度其實會比較說如果法令規定說他的個子就是不能出診所可是所有的診所都還是要一起training就是你只要硬著頭皮去做federated training這確實目前還是research比較難OK很棒所以現在你叫一個開放AI平台所以有別人在用所以就是我們剛剛看到的這些哪些是第三方這都是我們做的這都是第一方的我們是有一個開放平台讓學生時間在那邊註冊然後使用那包含語音辨識的部分甚至裡面提供一個設計好的一個換句子這樣有一整套sdk讓學生或者是有興趣接觸可以出語音辨識OK所以這個sdk你們會寫一些程式嗎他們就自己去改大概哪些地方在學校或哪些在用現在目前接觸還是學校居多會比較高中現在看到都大學都大學黑克松OK因為我覺得這是一個很好的資源如果他要做一下黑克松這些身形的時候他可以節省一些開發的力氣那帶你們的這個套件裡面有吧好比像說Edge的部分還是都是雲端的部分自己做看看的一個東西目前我們台大那個創克松或是去年年底的那個新大黑克松沒有參加集風套件讓學生能夠舉動套件你的輸入方式輸入方式我只是說這邊我只是做一個很簡單的說我可以做所以這個東西呢我可以幫辨識結果丟到任何一個網頁的ADBUS上面就算要說我可以用用辨識的方式去做一個丟到任何一個網頁的ADBUS上面你就可以不用手去輸入尤其是像ATX的經濟可能沒有辦法去要Keyboard去輸入就用你的方式這就是Windows嘛我的意思是說你沒有做你要說Android或是當這個環境呢其實我們也是用一堆丟到PC的這個再把丟到一直定的ADBUS上面跟你們策略上面有做一個號碑上說Android的輸入方的原因就是因為你剛剛講說從一半的按就是使用的請進一下你收到的資料對你一定不是非常有意義的是不是這樣嗎當然後來iOS上也有他的目的當然很明顯就是要收這些Corpus那我不知道這個對你們有意義嗎我們是沒有做這一塊因為那時候的想法是我們現在的想法是說如果收集這個其實整體這個我們必須要反而會花更多時間對你有Pipeline對你有幫助你要是沒有那麼多人在那邊做Tagging就是只要只會做Pipeline的錢其實上又做不到所以我蠻好奇想那像AI level他後面有很多標註人員在支持他他有一些人但是他是一個非營利的目的他還可以做到這樣子對主要他已經把他想成一個預程中心他找到一些好題目但是就會spin off你要很像去inpower你的別的事業部門那這個才是主要的mission要往外面2C賣東西可能不是你們存放的mission對那他們的話就是2C找到一個fitfit之後他的這個團隊也許spin off我想策略會不太一樣但台語我想是很棒顯然是表示你們事業體裡有需求不管是這個照護是好看有沒有補充的我覺得到這樣也很好應該是說因為你就是說我是希望透過這樣其實台灣也有一些不錯的一些本土的廠商在這一塊那如果說有什麼機會也可以幫我們推薦其實我們有時候最需要就是有場域不落地能夠去發揮他的功能然後我們有時候面臨這種就是像那個GoogleMicrosoft這些巨破之後其實我們也說蠻難真的能夠好好的去發揮的主要他有一個生態系就是有大堆人幫他們寫錢覺得Google弄一個API出來就是有什麼AutoSava什麼東西那其實都不是Google的人寫的那就是大家這個沒事就幫他們寫一些所以其實即使他的辨識率不高然後都有feedback那慢慢就變好了所以我想就是我想你們前段的部分如果目前聽起來還是以大學練習為主的話我覺得也許我主要能夠幫忙就是說如果聽到有沒有有什麼前段上的需求的話那就告訴他們說那Olamin也可以申請如果他有Edge的需求他可能就要單獨跟你們看目前沒有這個SDK那其他還有什麼可以幫忙你們現在Cloud的那個SDK有台語嗎那所以我如果要測台語我有什麼辦法嗎測台語的部分可能我在提供有一個好啊因為我想就是因為之前AiLabs也有給過他們的就是就是Fantasy中文的那個API那個是在就是整套就是亞丁網站上線之前我們的一些人封測然後也給了一些feedback但是因為看起來你們已經早就過了那個階段對所以反而也許我可以給的一些是台語的因為台語的我之前只接觸過異傳異傳目前的證據率也還在就是大的證據都沒有像你們剛剛demo的那麼好那當然就是說我現在也不知道說你是不是確認的時候只用那兩個人的聲音就才會不知道我有哪些可以幫忙的對但是我想台語是真正是有需求然後公視也好我們國家語言發展法通過之後本來就是台語就會有一些國家語言責任不得這樣一些工作需要做所以我想我和我的朋友或者是公網機構的朋友因為我上公視台我的機器人上公視台他們也有提到說其實他們現在像我這個年紀的人講的一定都不標準這是無所謂的但是就是說他就要一直來糾正證明嘛證明你想標準可是你如果要每一個來賓都有一個證明老師一對一公視台還沒有那麼多人對但如果你可以有一個類似像你剛剛那個浪都的輔助者那你給我一段台語我就念的就是有點就是爛爛的他告訴我哪裡反應不對那反而不是要挑他是他來挑我那這個我覺得是很有幫助而且他們那邊一定會很需要那他們來賓來以前就先用這個程式用到300小時再給我上節目這樣子他就不會在節目上一直吃螺絲所以我覺得這個scenario是核心的那可能比因為你剛剛講的那個公視上字幕的那個delay技術性延遲30秒就解決了他其實不需要用你這一套他可以用他本來那一套只是多一個buffer所以這個大概不會構成他來找你的理解但是台語台很可能有所以我想如果你可以反正兩個API我如果可以都串一下反正我剛剛看到你們竟然有pro的這個套件那就很棒那我就先自己測測看那如果這個部分我覺得還不錯那我再跟不管公視台語台語或者是民間一些台語社群的朋友我們交換一下意見看說怎麼樣把它變成一個讓我們在現在台語台剛好他在剛開台就是這個母語復正的這個過程裡面可以先做一些什麼對那其他的部分我覺得我們現在講的就是華語的部分剛剛講就是單一字母的部分然後短間隔短空白這個我知道技術上很難因為你們要改整個系統下作才能夠做到但是也許可以考慮說就是你剛剛那個編輯界面裡面他的就是在辨識的過程裡面你可以把那個segmentation弄得再少一點因為剛剛聽起來只要我中間不要聽到很久全部都是一大段完全只是UI上的話你也可以考慮說大概100字或甚至不到100字80字就無論如何應該要斷了你在這個segment裡面最長的那個間隔即使他是斷的你也應該把它算成斷行不然的話我覺得在編輯上就編輯者是很困難那其他大概就是剛剛講的單一英文字母大概就這樣完全都非常棒好好的一部分就很好用了我們這個反正也沒有什麼業務機密如果大家同意我就直接破爛我們YouTube上如果大家看了之後就直接跟你們聯絡了真的很棒謝謝謝謝好那就再等你們的APIT我們台語台語有自己評估台語大概要做到100小時左右大概我們現在大概做到大概100出頭但是公視台語台有很多語料我們其實收集語料也是一個大問題但是如果能夠跟台語台每天都在產出語料我覺得台語台的一個好處是說它的收音設備非常好對對你們來講你清的那個成本很低而且你要找非常懂台語而且能夠不要到聲調的人單位成本非常高有台語老師幫你清完我覺得至少對你不strap會很有幫助那我們試試看謝謝