好 那我們可以開始了那其實都可以來先好 大家好 我是國防中心的林俊宇那我們今天我想我主要利用這個機會來用一個很簡單的case一個simple reduction的benchmark來看看我們未來在如果要應用這個同態加密的話可能會遇到一些困難以及它效能上的一些行為另外我們在設想一些可能的應用那同態加密其實就是我可以在不用解密的情況下進行加密所以基本上它補足了現在資訊安全計算儲存網路計算這一塊的資安隱密系的部分那所以基本上它可以做任意的針對任意的加密的data做運算包含像是簡單的統計或者是甚至機器學習甚至是搜尋資料庫等等其實它用到的背後的原理其實是在這個加密系統裡面明文跟密文上它有一個所謂同態的關係也就是一對一的對應所以它可以在密文的空間裡面做一些操作那在明文的空間裡面它得到的結果是一樣的所以其實這並不是一個新的東西因為很多傳統的加密的系統裡面它都有這樣的數學結構所以像早期我們可能常聽到的RSA等等它其實就是某種所謂的partialpartial的homomorphism encryption但是它只支援懲罰等一下我們會看到所以它一個只支援懲罰的同態加密它有一些好處但通用性並不是那麼廣因為我們希望的是能夠起碼支援懲罰跟加罰那這樣子in principle它可以做任何事情那在早期還有一些像是所謂的sunward homomorphism encryption那它支援懲罰跟加罰但是它的壞處就是它只支援有限制的懲罰跟加罰所以這也不是很好用因為對於像一些需要做iteration的case像是machine learning的話它需要一直做一直做所以這個也不是很好用所以我們目前比較常見的sorry目前比較熱門的全同態加密它其實是based on一個叫做金格密碼學的東西這個東西現在還蠻熱門的因為它跟quantum computer其實還有一點點關係它號稱是在那個厚量子加密加密它是一種厚量子加密的系統因為它號稱它可以甚至抵擋quantum computer的攻擊不過這個是題外話那但是這個金格密基於金格密碼學的同態加密它有一個問題就是它的原理基本上是把名文加上一堆noise來做操作所以當你的計算一直下去做一個懲罰做個加法一直做一直做它的noise會越來越大導致你沒有辦法解密所以其實在過去這幾年這些community他們花了很大的功夫就是怎麼樣去控制這個noise那在09年有一個突破是IBM的gentry它想了一招就是它把這個密文解密再加密達到一個刷新密文的效果但是但是因為你但是它這邊重點是它解密的東西是用加密的密藥去解密因為你不希望你的密藥讓其他人知道所以各位可以想像這個是一個用同態計算來做加密解密的動作這是一個非常好支援的所以這也是為什麼後來我們現在所使用的其實並不是直接用這個很昂貴的boostrapping的方法現在其實有很多其他的方法像是renealizationkey switchingmodule switching這些有點進式的方法但是它達到控制noise的效果還不錯所以我們現在所用的這些open source project其實很多其實只基於這個比較是進式的結果那這些領域現在蠻熱門的所以甚至已經在這個community有一些technical的standard已經慢慢在成型了因為各位可以想像這種跟資安相關的東西未來一定是會慢慢形成一個標準然後大家才有在開發的人使用的人才有一個規範所以這些像美國的neast他們類似國家標準局的單位都有在做這樣的事情好所以這是一個example讓各位大概有個感覺就是像傳統的RSA它是所謂的partial homomorphism encryption那其實就是因為在它的數學結構裡面它牽涉到的是這個明文的明文的它的加密結構就是把明文做一個power所以各位可以想像在這個case底下我把兩個加密的東西沉在一起它這個root部分是可以沉在一起的所以用這種結構就保證了它的懲罰是在加密空間跟非加密空間是preserve所以這只是一個讓各位有一個sense知道說他們背後的結構大概是怎麼樣子那麼在金格密碼學裡面它有一些基本的操作它允許一些基本的操作那其中它的代數結構還允許另外一件事情這是一個滿好的事情是它允許明文密文的batch的操作就是說它在沒有這個之前我們在加密解密一次只能加密一個訊號一個訊息但是不過我們把很多訊息派個成一個大的比較大的密文它可以一次的加密解密就一次做掉了這麼多密文的加密解密所以一般來講這個batch site可以到8K甚至16K以上所以這個效率是很恐怖的它一次可以把這個效能提升很多有點類似多核心計算的感覺所以它在這些框架底下它允許了幾個基本操作就是第一個是這整個batch vector它的element wise的懲罰跟加法這是全同態加密的基本要求所以我可以把兩個batch做懲罰或做加法另外一個它可以操作的事情是它允許讓這個batch裡面的element它全部往左後往右shift所以我可以shift by一個set by一個offset或兩offset這樣子這是它基本的操作因此所有其他的操作都可以用這些操作把它組合起來例如說我可以把一個vector01000乘上一個密文它就我們就有辦法把密文的其中一個element挑出來這是一個做法另外一個是假設我有很多密文C1 C2 C3 C4我把這些密文裡面的某一個element全部挑出來組成另外一個密文這個操作我們叫merge這其實等一下我們再看我們的reduction的benchmark裡面會用到這個東西另外像比較排序這些東西都是可行的但因為它牽涉到的計算稍微複雜一點所以目前的一些open source package對於comparison的資源還比較差一點不過imprinciple也是可以做的所以如果可以做到comparison那我們基本上就可以做現在資料庫可以做的任何事情我可以做sorting我可以做sorting相關的事情好那這個是一個現在幾個比較常見比較熱門的open source project以及他們所支援的各種不同的演算法那比較大的就是像IBM的HELP然後Microsoft CEO跟Policy它是另外一家公司叫duality那我們今天主要就是用policy來做這樣的benchmark那其他的話應該算一些比較新的嘗試那有一些像GPU的project不過這個相對它的規模都好像都比較小一點很走是他們各個所支援的不同的演算法那目前同代加密有幾個比較主要的演算法是像BGV這是三個不同的人三個人 人民的縮寫那他支援整數的操作CKKS也是四個韓國人的縮寫他支援時數的操作你可以處理小數點那另外一個也是支援整數那也有支援布林代數等等那這個Bruce Trapping就是我剛剛提到的他們就直接把Bruce Trapping實作在裡面那這個我們比較不會去討論到所以今天我想就是主要focus是在整數跟整數這兩個case我們來針對這兩個case來做個benchmark今天的目的主要是這樣子好 那我的benchmark的scenario就是一個同代加密最典型的應用他就是把計算外包到其他機器上像外包在Google雲端Amazon雲端或者是國王的雲端那在資安的要求Data Owner資料用途者希望雲端的機器希望雲端的機器不要知道我們在算什麼東西所以我們基本的scenario就是假設我有一個table那有很多column那我身為一個Data Owner我先產生key然後我把這些資料加密起來送到雲端上面那雲端上我們可以做一些簡單的操作例如說我們這邊就實驗了一個1000萬個number的reduction它可以是平方和甚至是三四方和等等那所牽涉的所牽涉到的幾個基本的操作就是像key generation加密然後計算跟解密所以這個整個操作其實可以把它想成是現在公要系統的延伸因為在公要系統裡面我們所謂公要加密系統裡面我們其實已經牽涉到key的產生加密跟解密的部分那在同代加密就是多了一個加密的計算這個部分所以主要的idea是這樣子好的那這怎麼樣做一個一個很大的data set的reduction呢這邊其實它的概念非常簡單那我們主要例如說我有一個table然後我要把這個column可能是1000萬比2000萬比把它做一個reduction先平方和甚至更複雜的計算所以我們要先知道它裡面一個最關鍵的地方就是一個cypher text我剛剛提到一個batch的cypher text它最多就是支援8K或16K的batch所以我們的strategy就是處理就是處理用batch by batch的方式處理這個這麼多的data set所以我們先例如說8K先針對這個8K的data做一個partial sum那因為這是蜜吻所以我們沒有辦法像傳統用一個do loop去做它的sum所以我們需要用剛剛提到的那幾個基本的操作那以上為例的話其實我們發現只要基本上你只要透過rotation跟相加就可以完成這件事情而且假設是8K的資料量的話其實我們不用真的去rotate 8K一次它其實有更快的做法是rotate lock 8K一次所以大概是十幾十三十四次左右就可以完成的做出來那像這邊的話這個綠色這個橙色的部分其實就是我們不會去用到資料但是因為我們是一次針對這整個蜜吻所操作所以它還是會算在裡面所以這樣做完之後我們最後會得到這個在這個8K的蜜吻裡面我們會得到每一個album都會得到這個batch的partial sum所以這是一個蠻關鍵的步驟這聽起來其實蠻straight for work但是如果但是剛開始我們其實花了不少花了浪費了不少時間因為之前沒有理解到這件事情所以之前就是很拿意義的直接把整個東西做加密但是它程式其實不會爆錯但是你發現它的答案是錯的所以看來所以我覺得這個是比較關鍵的部分好 那最後有了partial sum之後我們再把這些每一個batch的蜜吻的第一個animate挑出來merge出來得到另外一個蜜吻然後我們再重複這個reduction的動作再做一次所以整個過程就是整個過程做reduction過程其實蠻單純的那如果說有在寫GPU程式或者是多核心計算的朋友其實對這個過程應該是蠻熟悉的因為我們發現在GPU或者是多核心計算在處理相量的reduction它其實也是用這種方式來做這是比較有效率的做法好 那如果我們現在看一個partisay一個code的大概的架構它其實就是重複我們剛剛提到的四個animatekey generationincruptionevolution跟deception那目前這些open source的project它其實對這些資源都蠻人性化的所以其實提供的function如果我們知道它裡面這個同代加密的步驟其實我們其實直接看它的function的名稱你大概就知道怎麼用了那只是要小心這些參數的操作所以呢大概它的參數的操作要注意的幾個參數其實它像這邊的話在定義這個context在這個定義這個crypto context的時候它其實牽涉到蠻多參數那其實我們大部分的情況下它的預設值都還可以接受因為它們其實有根據這個community提出的stand up它們已經針對各種不同的security levelyear about bit192 bit256 bit做一些這些參數的預設值所以對於一個使用者我們其實還不用去擔心太多基本上用它的預設值都還可以操作比較要注意的幾個參數就是像這個懲罰的深度就是因為我提到我們現在這個方式其實並不是最general的boost trapping的方式它是有點approximate的方式所以你必須要先知道你的計算它的最大的深度是多少假設是一個懲罰它的深度是1然後兩個懲罰sorry一個懲罰深度是兩個數字的相乘深度是1那四個數字的相乘它的深度是2因為我可以兩個兩個相乘一次然後再把兩個兩個乘出來結果再乘一次所以它的深度基本上假設是N四方的話它的深度基本上是log2nOK那另外一個參數是名文跟密文它的modularp跟q它的意思是因為它們的操作是基本上是用用modular的操作所以假設這個數字假設你的參數是50的話那51它是把它當成1來看因為它是用majus來操作因此這個參數相當於定義了你可以支援最大數字的range有點像是在寫C元的時候我們整數跟浮臉數它都有一個range所以這個是也是要稍微注意的那如果說我把p設成50的話它的50個bit它的所支援的precision大概就是15個位數大概就是double precision的寬度那密文的寬度會稍微比密文的寬度大一點但是因為密文其實根據這個table給定了secret level它其實有一些規範那這個q也不能太大因為根據它這邊提供的table其實你發現要求的secret level越高hard q其實是越小的所以大概可以想像成說假設你塞了太多東西在裡面其實它的安全性反而會小降可能有一些reundance在裡面這邊這邊背後可能有一些比較細緻的數學探討需要去考慮那最後有一個ring dimension的參數這個參數其實它對應到的就是batch size的大小所以所以這個就是我們要注意的幾個參數好的好那我在test的話我用了我們中心的兩個機器一個是on架構的機器一個是intel架構的機器這兩個架構的規格其實都差不多都是在18年左右的機器所以他們的它的石脈以及它的記憶體的規格都差不多那比較不一樣就是我這邊在on的機器上因為我是把hypersalin打開所以它這邊最高可以支援256 core好的我這邊其實有本來有準備一個簡單的demo但其實因為所以整個程式跑完的話它其實就是我們就是重複我們剛剛看到的幾個步驟它先產生oh sorry這個4號都可以重新剪輯對啊就是如果你覺得不順你可以重新配幾遍我這邊有強大的後製的方式ok只要你右手邊所以這個是我剛剛跑了一個簡單的case那所以它其實就是先程式剛開始它會先這個可能要再大一點所以它會先定義這個crypto context的參數像是ring dimension然後p跟q等等那我這邊用的batch size是8k的batch然後總共大概2000多個batch每一個batch是8k所以總共可以支援的參數的數字大概是1000萬左右那剛開始會先產生key然後接下來它會把每一個batchbatch by batch的去做加密所以這每一個點就是它去操作完一個batch就出來一次所以有2000個點然後最後再算partial sumbatch sum然後最後再把這個結果merge起來那我們等一下會看到一些詳細的譚明的資訊剛剛的舉是你已經修改了解密之後做還是這邊都還是這邊都還是加密的狀態然後我們的目的就是全部算完一個數字最後再把加密的結果傳回U設它自己回來的這個packet非常小它只是一個數字的大小那當然這樣子的算法是前提是這種加總它是embarrassingly proud什麼分非常容易變形才能這樣算可以看到CPU到後面是OK等一下所以所以這邊就是剛剛那個case簡單的CPU的history跟memory的history等一下我們會看到它其實花了所以各位可以看到它其實花了很長的時間在做rotation key的產生因為我們剛剛提到說最後在做merge的時候它要把不同這個2000多個batch的每一個partial sum都抽出來所以它需要它需要它基本上需要一個full rotation key其實這邊是可以優化但是我們這邊就先用先把每一個rotation的offset的產生的key都產生出來這邊particy裡面的implementation可能可以再優化一點所以這邊看到它的CPU使用率我們在16Core上面跑它的CPU使用率其實大概大概大概200不到這邊是屏效率稍微差一點那所以你看它的memory其實隨著一個key做好它memory就慢慢上升上升完最後做好之後我這邊產生一個sample data一堆1000多萬個sample data然後再把它用CPU沒有加密的情況把它加起來這個其實是一瞬間的事情然後接下來它把這1000多個databatch by batch的做incryption以及算batch sum那這邊因為我們是直接去用openmp的平行所以這邊基本上是完全平行的所以你可以看它的CPU使用率幾乎是百分之百這邊百分之1600所以是用滿16個核心那最後在merge的時候這邊它的平行效率稍微下漲一點不過這個也是因為這個是在policy裡面的實作所以我們這邊也沒有特別去做特別平行的優化所以整個Hitry看起來大概是這樣子然後那時候當然你覺得還是有優化的分析所以你這個因為現在這個CPU移動還可以再所以那你覺得藍色的線是什麼這個橘色藍色都是記憶體是這個是比較因為在電因為在我們在monitoringlinux系統其實你可以看到兩種不同的記憶體一種是virtual memory一種是resident memory不過一般我們其實不用care這麼多一般通常virtual memory會比resident memory再大一點因為它還包含了一些share memory等等之類的所以如果真的要計較的話我們其實只要看橘色的部分因為它反映的就是這個程式本身記憶體的用料所以你這張圖能講for location vision跟merge理論上我們如果三面肌的話都可以減到大概十幾秒在最好的情況就是如果是那些完全用壓角對所以這兩個部分其實是如果對Policy的有興趣的人是可以再進去研究它裡面是怎麼實做的的確是有優化的空間實驗套分說實驗對那我初步看起來它裡面是沒有做太特殊的優化例如說它連OpenMP都沒有所以maybe一個OpenMP加上去對啊就會快一點加一個那個Vation就把它加起來很多好那我們更有興趣的是它在那剛剛這個是history那在EvaluationEvaluationPan的部分我們是希望找到一個比較具體的數據來衡量在不同機器下或是以後不同case上面要怎麼衡量這個問題所以我這邊選了一個叫做Effective FlopsPercol的劑量它基本上是反映出每單位核心以單位時間它的計算量理論的計算量所以我們舉了三個例子例如說我做整數的平方核所以我算大概800多萬個數字的平方核這是時數的平方核以及時數的Sigmoid的核所以他們的計算量分別是2n,2n跟7n那這邊Sigmoid因為同代加密它不支援一些非Pollinominal的function像是Exponential Function它不支援所以我們必須要用一些極速展開的方式目前展開到第三階所以它的計算量算一算大概就是7倍的7倍的Data Size那我們去計算出來結果大概發現CPU跟所謂就是有加密跟沒有加密的計算它的差別大概以時數的部分大概都是差大概5千、6千倍左右所以這個聽起來蠻恐怖的但其實我們如果看其實非常好5千多倍就表示可以用了對對所以如果我們去看它實際的時間在Intel記憶上我們去算800多萬個數字的加總它其實也才花個不到2分鐘、3分鐘的時間所以至少在簡單的case這個是可以用的因為你們的重機都比這台電腦好5千多對要全開的時候這個其實有一個誤區因為剛剛說是用重機電腦來做測試但其實因為演算法本身的特性我們它其實反映出了也只是單台機器的CPU的case這我理解但是因為我們如果挑的題目是非常容易變形的話那理論上重機裡面每台電腦就算其中一台電腦就行了它可以在最後解出名文的時候再全部加起來因為我們現在的設計上面是你的家總是在密文情態情況做但是其實並沒有什麼原因要這樣子因為重機裡面每一台電腦都換一個數字我自己加一加也不會怎麼樣對OK因為我看Vivo剛才說是百萬倍的對然後我們就覺得很泡沫泡沫泡沫泡沫上完的明年的數字也進來所以我就說好 OK想不到一萬倍我覺得還不錯好接下來要考慮的就是那個size的部分就是它key的大小以及密文的大小那這邊結果也是蠻樂觀的因為我發現明文跟key的大小其實只跟它的batch size跟你的密文的bit有關所以大概算一算不會超過一個Mega很少那密文的話密文的結構其實跟public keys是一樣的所以也同樣是512K每個batch所以這個也還好如果我們跟沒有加密的double precision的數字相比大概也才多個20倍不到左右所以這個也是可以接受的那接下來就是我們剛剛提到他們在處理這個noise的時候他們其實牽涉到這些除了功耀跟私耀之外他在做計算的時候也需要引進一些key叫做計算的key去彌補那些noise的問題所以這邊我們會牽涉到懲罰的key跟rotation key上key其實跟rotation key是一樣的只不過因為上有一些optimization所以他不需要做到full rotation key他只需要log under key就好所以你發現這個大小也是蠻promising的這個橫軸是data size重軸是mega byte所以懲罰的key基本上不depend on data size所以這個是沒有問題的才不到一個mega一個mega左右比較有問題的是full rotation key因為基本上他跟batch number是線性成長的所以最大甚至可以到一個giga剩10個giga左右但是因為這種key他其實是只要計算一剛開始他其實只要送一次就好因為假設有一個客戶跟雲端他其實只要這個客戶關係建立起來先做一次就好所以這個也還好而且我們去看他真實的時間傳一個giga以下的網路100mega byte大概也才1分鐘2分鐘左右所以這個都還應該就是在henshade的時候先傳完對對對我們還在談這個合作關係甚至NBA在簽的時候就慢慢傳所以誰聽愛漢堂那最後一個有趣的發現就是如果我們把這些東西再做壓縮的話你發現他大概都可以達到8層的壓縮率而且剛好是8層我其實不知道為什麼可能跟他裡面亂數的亂度有關吧剛好都是8層exactly please 8層最後我們看一下他的正確性因為他跟double position計算的結果一定會有一些差別整數沒有問題整數當然是一樣那在時數的話你我們發現對於幾個case他其實誤差相對誤差都在百分之都在百分之負都在十的負7個percent以下所以這是完全可以接受的就說完全沒問題對完全沒問題那這種情況用double position你沒有什麼太大意義有問題差別就說用一個就可以了用擔心步就可以我這邊的意思是說那個統態加密的結果跟double position的結果相不出來這樣可是既然有這樣誤差的話那代表說你用double position對好那最後這是一個小節就是我們從我們的實驗大底上這個整個結果是蠻樂觀的至少如果對一些privacy critical的應用他對效能可能不是那麼的care的話我想這個以目前的技術應該是沒有問題的我們只要在仔細推敲那些參數的設定跟安全性的評估然後key的交換這些反而是比較重要的效能倒不是什麼需要考慮的地方另外我們也學到幾件事情像是統態加密特別是全統態加密他目前的研究其實是蠻踴躍的目前技術上的standard也慢慢在成型然後甚至於如果我們要推廣到multiparty的系統如果牽涉到你的data owner不是只有一個有很多個其實他們也有solution在做這些multi-key的solution所以這個solution是有的只不過唯一的一點點的要consent的是他的key generation跟decryption都是需要這幾個party彼此互相interactive的做所以這個可能效能上會要稍微注意但是solution是有的然後在前年2018年新加坡的group他們也有實作出一個統態加密的GPUMachine Learning在影像辨識上面所以已經有人做過這樣的嘗試了那另外有一個蠻有趣的workshop是這個community他們是美國NIH他Own的一個活動叫做I-DashIntegrated Data for AnalysisArmor Analyzing and Sharing他每年除了workshop之外他會有一個對應的competition他每年會選幾個題目然後廣邀世界各地的團隊來針對這個題目來做比賽像過去幾年的題目都涵蓋很廣除了統態加密的部分之外還有硬體層級的加密就是這個SGX是intel他提出的一個硬體加密的方案他們全部都是用生意領域的也不一定只是因為生意領域現在可能因為畢竟是NIH辦了而且生意領域的確也是比較多這方面的應用對他們的constration比較多所以他還有做這些Defential Privacy跟SMPC的問題甚至有blockchain所以有往前的我看一下就是精準是要都有了後面到前面都要所以像這幾年在統態加密的部分他題目就是像這個腫瘤腫瘤預測的然後基因體分析的這也是基因體分析這邊我補充一下去年Casper有影片用的我們也開始做相機加速器讓他的目標就是希望能夠做Wheel tanknebrates在REFLECT的情況下做所以雖然說今天這個可能Promise is for statistical application這個比較沒有激活性但是相機能力隨便就是Milliams of applications所以那個就需要加速器那現在加速器滿Promise那大概可以再把這個速度加速到這個一萬倍可以做一個Equance簡單的Equance大概一個月期可以進到反正那種加速器我想最近可能接下來了我覺得這個也是我們今天業者的機會他的場景就是一進來就要算Promise就沒有辦法等屁股對好那最後我們來最後這個最後是我整理了一些同胎加密在安全性評估安全性方面的問題這其實這一頁的同影片的內容其實是比較我覺得是比較學術性的不過至少他給出了一個comment就是目前的大部分的同胎加密起碼都滿足最低要求的所謂的語意安全性的這個要求那語意安全性基本上就是基本上就是同樣一個名文加密不同次它出來的結果是不一樣的那這個是一個最起碼的要求那當然如果這個 scenario 更寬的話他的安全性的考量就更多了那這些都有蠻多的paper在討論這些事情那我想只是點出這個問題Maybe未來對安全性的有安全性的考量的話可以再注意一下好那最後最後結束前我想我就引用這個他們這個同胎加密 community他們在在過去這幾年釋出了一個白皮書然後他們是規劃了他們設想的幾種可能的應用場景從基因分析這個沒有問題然後到健保這應該是跟健保相關的being and reporting然後還有國安像是smart grid的部分就是假設假設在假設一個場景就是在做智慧電網的監控那可能那個決策者要根據智慧電網的監控結果來做一些決策那可以想像的是這跟決策相關的東西那這個過程中心的安全性是有要求的最後在教育的部分這個是美國他們要去研究這個不同學校他們這些錯學的學生就是什麼學生比較容易錯學等等那似乎他們有一個法規在規範的時候不能去release這個學生的資料所以他們也有這樣的考量那像這個social security應該是跟cybercoin有關的像是信用卡倒刷等等那business analytics大概就是跟我們今天所講的這個統計相關是比較有關的最後是這個就是最標準的應用計算的outsourcing那我們自己可以設想的幾個可能性就是我們根據我們現在有的技術有的經驗大概可以設想的可能性接下來要做的幾件事情可以做的一個是所謂的older statistics就是我們去思考怎麼樣做comparison怎麼樣做 ordering這樣子起碼我們可以把傳統資料庫常見的一些操作可以用同胎的加密來操作一次再來是簡單的machine learning像是locustic regression甚至於是neuron network training那它的場景是這邊設想的場景是可能像有一些半導體業他們不同的產線他們都有一些生產的參數他們可能會需要去針對這些生產的參數去做最佳化等等據我所知因為我並不是業內人但是聽說他們對安全性的要求是非常嚴格的甚至連同一家公司的產線跟產線之間的資料的交換也是非常保密的所以maybemaybe這個可能也是一個應用的場景不過這當然是要跟應用端再協調才有辦法那最後是一些影像疾病預測的machine learningimagine的machine learning好 那我想我在H1的部分就到這邊那接下來的話我請眷來幫我們補充一下我有一個想要問眷員 剛剛有個城市那個城市聽起來是Hobby Say他 native API但是因為剛剛老師提到加速的元件那一般像我們做AI的話像PyTorch他其實不是在你剛剛寫的這一集他是在比較抽象層面然後他有很多個後端那所以目前在H1裡面有沒有像LVM這種東西就是你只要寫高階的那他就幫你變成好幾個後端因為剛剛聽起來每個後端能做的事情不太一樣有的他現在像我們如果回到最前面這一頁的話這邊都是Library的層級然後每一個Library提供的就是像key generationinclusion等等這種基本的操作的確是有一些project都是非常初期的project他試圖要再設想一個common API然後你底層可以去抽換掉這些不同的Library的確是有我目前看到大概是兩個但是我的評估是那些大部分都還是可能一個實驗室自己的嘗試這還不是所謂的industrial standard還沒有業界標準因為畢竟這個才剛開始這個本身他技術的standard也才剛形成而已所以我想這可能需要一點所以覺得再等一下才有抽象然後我們目前就是挑一個比較廣的Library來用現在這些基本上是技術的Library那在上面有一些Domain specific的Library像你們問的你看這個但Facebook有所以我們有在看要規定規定那這個東西可以逐漸可能有一些公司因為Library這個真的是對業界比較重要有侵犯的東西那他這部分我們覺得是在觀察所以現在真的看那上面入企大概我會說他還在Alpha去使用系統大概還在Busy還在Busy謝謝OK那我想最後這一頁的話就是我們現在設想了幾個國工座跟計畫是不是請眷來我只是來現在簡單的說明一下我們的國防中心在HE和相關的Privacy EnhancementEhancement的Technology方面的工作和計畫然後第一個就是要比較一些HE的Open SourceLibraries但已經在第五頁的時候有看到說我們列了從那個Wikipedia列了9個Open SourceLibraries所以我們從中間選了其實從三個比較Popular的就是第一個當然就是Privacy那是均已經做完的然後另外兩個呢一個是IBM的HE Lab然後還有Microsoft的CEO然後我們現在都各有同仁在研究其他的兩個Libraries那我們是希望說能夠來比較一下他們的Performance這是第一個希望在第一季能夠有一些成果然後第二個因為基本上我們現在做的這些比較會繼續做的都是比較基本的統計量的一些算法而已那我們希望能夠去實驗一些比較比較實用的一些應用案例然後就剛才我們列了三個Candidates然後或者說您這邊有沒有一些從政府方面有沒有什麼應用案例的話我們可以一起一起來合作尤其是如果說你能夠提供資料的話那這個方式我們覺得說我們自己內部做可能會比較慢所以說我們基本上可以跟國外的一些工商Deality和IBM我們可以跟他們做一些Cooperation因為我們已經跟他們都有開會過然後他也很願意說跟我們一起做一個POC但是那個應用案例需要就是比較很明確的定義就不能說很很很或者說只是把數字加起來對或者是說因為現在其實PyroCity的SorryDeality他們有一個commercialized product叫做secure plus他們其實都已經有一些gooey你creak一個一些件結果就馬上就出來了對就做那些POC基本上對他們來說實在是太容易了不過浩比向說你給定那個s-long或者s-long delta然後他就生合成資料處這個導致一個學界已經定義非常清楚的一個案例就說我有RODATA我想要省服某些條件的合成資料但是我生這個資料的過程我不想讓你看到RODATA那這個我不會說這個是我立刻就可以想到的一個用力而且還蠻確定的好那我們可以跟他們再討論一下另外一個第二個方面就是我們可以去參加iDash的competitions因為他每年的話他們都會公布一些不同的traps大概每年大概都有三到四個traps就不管在HEA或者是在Federal Racial Learning或者在Blockchain都有那其實我們中心都有做這方面的研究搞不好就是可以藉這個機會來看看試試看我們的對 實力到底是怎麼樣那今年的time line還沒確定然後至少去年的時候是8月報名然後10月底節大概都給你有三個月的時間可以做一些實驗因為他們都會給你題目很明確的題目還有很明確的還有給你data就有點像Cackle的那種competition一樣然後最後會有個Walkshop會announcewinners然後裡面大家會有一些share這些他們到底怎麼去怎麼去做把這些東西實做出來那我們剛才講的這些這些都是基本上都是非常別人已經現成的東西open source的東西那我們中心自己有一位研究員是舒正耀博士他有提出了一個他自己HEA的方法因為原來他是研究聽不懂說原來現在還是在研究量子運算的對基本上他把量子運算的那些概念然後把他衍生到HEA的地方基本上他有一個理論就是叫做Quap Coaching Algebra Petition那個概念老實我先澄清他的數學完全不懂太先進了完全看不懂但是概念基本上就很簡單就是要把原來在古典的線性的碼把它延展到所謂的量子的世界或者就叫做Huber Space上面那這樣子透過這樣子的延展那原來這些基本的運算不管加法或成法都能夠把它保留住然後不需要像現在的HEA上面的一些要做Boostrapping要去做一些Air Correction那邊完全不會碰到它沒有Noise對 它不會對所以基本上他這邊的話就可以你講很厲害我可能肯定一下也是Noise的但是硬體產對 但是他可以他的方法是基本上Noise沒有或者是很少那他把他在荒唇computing的一些應用剛好把他應用到這邊HEA上面因為都是然後他的運算都是在Huber Space上面對 他說他每算一次就像一些Air Correction Code所以他每一步都不習慣進去對 我剛看他的picture對只看得到結論中間過程完全看不懂對然後但是因為他現在都是已經把數學都導出來然後所以說接下來他現在已經在找一些學生在寫一些Code做一些實驗因為你數學導出來的話只是理論上證明說不管說是精確性或者是security都是比現在的就是所謂的Latest Space的這些方法要來得好但是實際上去實作未必所以說他們現在也已經在開始做寫一些Code然後而且是要在GPU上面去做運算的那是希望說在第二季的時候會有一些成果那這基本上就是我們中心現在不管在HEA或者是Failure Radio Learning或者甚至於Blockchain我們都有做一些研究然後如果說您這邊有興趣的話我們可以定期或者是不定期的來給您報告我們的一些進度和成果結果就是像今天錄影都用CC授權釋出所以我們定期來錄客戶影片這我會非常面對都沒有問題不是跟我一個人而已當然就是我關於他不知道我對之前有看Rainbow他們這個後量子加密學我光是多變量跟金德有什麼不一樣我大概就可以了解但是過程我完全看得懂我不只學這個所以目的還是說把它盡可能公開出來讓更多人能夠看得懂對 沒有問題因為這樣其實也會加速我們研究的動能因為像這一次的話我們就是因為也是要來跟您報告然後我們其實我們就才會有這麼快有那麼多的參數不然的話我再猜我們大概就是慢慢沒有更多的人可以看得懂而且因為我們很有幫助因為我們不管從法律上或者從實務應用上如果不知道說現在已經一百萬倍的delay變成可能一萬倍十萬倍的delay的話其實我們這邊也有很多東西不敢往這方向想所以我想雙方都是很有幫助對OK那基隆就是我們今天的報告看大家有沒有什麼想要提到其實我這個我真的是門外像我有講好好看真的還是因為這歌行五歌三我是自己覺得是說精準醫療的話我個人可能就像也有講就是我們家是實務部分那你錢的話你我也在健保學所以我覺得這個精準醫療很重要馬上立即針對健保的就是節流因為健保政策最主要財路的問題就是臺有同節那我覺得這個東西是真的就是說我們現在這邊現在在做的可能是圖過上再可能是針對的就是提到的就是可能說這個資訊流怎麼樣去把他整齊在一起然後再安靜自然讓可能我們像剛提到就是我講的就是說讓擔心有這個風險的根本都不用擔心其實已經進步到哪裡就是已經乾脆到到外太空了我們還還在本位體育在那裡想那我覺得這個真的很重要那我自己是比較針對是下一步就是說這個平台跟這個資訊的這個資訊流的整合的部分那我們也在因應的像我們最近這個COVID-19我有看一下那個我們的裡面的那個結構是這樣其實我覺得我們現在這個疫情的東西就是我們收了很多資料可是以後的疫情我們都覺得還會再來其實我覺得這些東西都能夠如果有事先在這個平台上都已經有然後下一步的在應用上我是針對的是後面的像譬如說它的除了食物應用殘學或者殘值的部分這個我是比較有趣的對那也是這樣其實我在應用的如果這邊看到這些資料有可能哪些的應用的話那有一些寫料的話我們可以試著看試著做的因為我之前是在長照其實我們都對就是我們台灣其實是長照才在攻擊端的起步就是一直在服務行該又要提高提高可是我們也一直在想就是台灣已經就是說國民的健康已經有一定的水準我們的知識部分也有只是因為華爾社會比較有一些觀念上要改變那可是我們會覺得說其實我們又有健保然後我們又有一些私人的data其實我們可以怎麼樣做因為健康是在前端例如Apple在後端你要怎麼樣去知道說我預先的都知道就像我們的這個cancer這個預測這個股價我是覺得就是我就看了一個圖牌我們就覺得說這個其實資料裡面其實也可以其實可以怎麼樣讓他可以做一些東西然後回饋到政策上回饋到政策的一些事情這是我只是初步因為自己太小那我就覺得就是這樣光是衛福部內部的三期機關之間的資料說連夜的經會就是因此受到一些啟發因為本來他們蒐集的時候都各自有各自的目的那當然都對衛福部來講一定更好的政策那這個跟這個目的看起來是契合的但是如果在中間就是雙方都有各自的第三方運算的夥伴那如果data的分享就變成幾乎不可能的事情對你們很期待了解我們現在就是說不用簽DNA用這個就好像在自己家裡算一樣但這個對他們是很有說服力對 非常好現在在科技部在對那個健康部長數據比例那個部分就是自行公立的情況下應該給你是一個好的起點但是有更多的資料你沒有拿到自己的東西或是過去的病例那個很重要對 因為你要有那些還見的因素那些我覺得可以從這個方法來搭配你的對 只要確保說像我們的為什麼其實挑這個好像toy problem原因也是因為這個當然如果你是在加密的狀態把家總都算完了你只拿一個總和絕對不可能反退出任何一列的資料的就是除非只有一列不然就絕對沒有很難反退那這個時候它就非常像我們在各自上上面說它是一統計目的來做使用只是說如果這一段程式大家都可以理解到這是統計目的的話那這個跟執行同理之間就慢慢比較脫鉤一些那以前都是說因為你在第三方運算者還是會拿到全部的RODE卡所以這都就必須要用別的方法來個臉好像繞到但是每一次繞到行程程度都非常高那我們是希望說可以做到說它完全不用繞著輪到那只要按一個鍵就跑去那邊算起來總是要回來這樣子所以才因此跳一個統計而不是學術目的因為學術目的有它自己的一個程序但是統計目的只要大家都同意是統計就可以了哥哥很負責任提到這個精神技巧的話其實國網在先前今天中原院的我們已經上次要提到有14萬的資金還有這些精神技巧的資訊那疫情也正在跟整個平台都在現在在談就是其他的三十幾個時候才要多資料那我覺得就是一個類似的其中一個是說把今天這些資訊要收集然後要整個接受申請的運用這樣子的一個討論過程當中對於這個資料的過程當然必須要有優勢可以發展的地球的運用但是剛剛上個提到一點比如說今天讓這些美定相關政策跟計畫的這些部分了解就是說可以請前方的這些接受的進展要注意一個程序的話可以影響到這些人大概是什麼樣的距離那麼在政策的中間推動的時候就比較知道可以說可以往這個方向去做我覺得這個其實在現在有沒有計畫政策在研究政策上也有幫助對就不用做以前的那種趨勢是主要的目的就是在所以剛剛其實在想說說像這樣子的一個資訊的公開那這個討論會錄影對然後其實如果有機會讓更多的資訊這些相關的單位就了解到技術的進展其實有這樣對於這個政策的計畫是我們是錄畫面配聲音公開這個我們一開完就會放到YouTube上面去大家都沒有講這麼多大機密所以對 那當然就是說如果你們之後還要用這個來製作可能剛剛解報的部分的影片什麼那如果要配字幕什麼那我們這邊當然有些資源或者你們也可以自己配可能專用名字會更精準一點那反正因為是CC秀群所以任何人都可以拿去運動知道嗎是那今天就非常謝謝謝謝大家 謝謝謝謝謝謝那就麻煩大家