 melihat versi yang lebih awal. Ini sangat baru. Jadi jika anda menghubungkan, saya menyebabkan anda seperti yang saya menyebabkan di sini. Jika anda menggunakan Windows, anda menghubungkan versi install yang ini. Kerana ia datang dengan listan corpus yang anda boleh menggunakan, seperti corpus kawasan Amerika, 2008, dan juga bahasa Inggeris, dan semua ini, corpus brown dan sebagainya. Jadi ia datang dengan corpus yang anda boleh bermain dengan. Jika anda menghubungkan yang berbentuk, ini lebih mudah, bermakna tiada installasi yang digunakan, anda menghubungkan, anda hanya klik, anda boleh menggunakan. Jadi ini mudah jika anda ingin memasukkan dalam perjalanan masa anda, jika anda mahu memuatnya sesuatu yang lebih mudah untuk usaha. Untuk Mac, anda boleh menghubungkan versi ini. Tentu saja, saya telah mencoba versi Mac juga. Yang ke-4 bukan begitu stabil. Jadi untuk Mac, anda mungkin mahu mencoba 3.5, tetapi anda boleh mencoba 4.2 dulu. Dan jika anda mencoba apa-apa masalah, anda boleh mencoba 3.5. Masalah itu selalu apa yang saya nampak adalah penghubungan atau corpus. Jika anda mempunyai kawasan yang sangat besar, apabila anda memasukkan, ia menyebabkan. Ia menyebabkan untuk versi Mac atau Mac. Untuk versi Windows sehingga ia stabil, kerana saya rasa mereka menggunakan Windows. Jadi anda boleh mencoba memasukkan ini dan memasukkan. Sangat cepat untuk memasukkan penghubungan. Dan kemudian memasukkannya. Setelah anda memasukkan, anda akan melihat ikon ini. Tetapi ikonnya, jika anda melihat penghubungan, penghubungan dan segala-galanya, anda memastikan anda membuat sebuah kartu di deskripsi anda. Atau jika anda tidak dapat melihat kartu-kartu, anda hanya memasukkan kartu-kartu dalam komputer anda. Untuk Mac, saya rasa ia cukup jauh untuk memasukkan kepada folder aplikasi, kemudian anda boleh memasukkan dengan secara langsung. Sekarang, apabila anda memasukkan, anda akan melihat ini. Pada keadaan saya kepada semua orang, sebelum kita bercakap tentang kartu-kartu, anda perlu mempunyai kawasan kawasan anda atau apa-apa pun yang anda mahu mengenai. Jika anda melakukan analisis kawasan kawasan yang muda, anda perlu pastikan kawasan anda bersiap-siap, seperti kompalasi. Untuk kawasan itu, anda boleh memasukkan kawasan kawasan anda di Microsoft, tetapi apabila anda mahu menggunakan EnCon, ia akan baik jika anda memasukkannya sebagai kawasan kawasan. Jadi apa yang saya selalu lakukan, saya akan memasukkannya dengan kawasan kawasan. Jika anda melihat komputer anda, anda akan melihat kawasan kawasan yang muda seperti ini. Kemudian anda boleh memasukkan kawasan anda. Kami akan melihat artikel kawasan. Mari kita melihat kawasan. Ada beberapa kawasan yang anda boleh memasukkan konten web secara langsung, tetapi saya melihat sebab kawasan kawasan yang berlaku dengan kawasan kawasan. Ia tidak berguna kerana, bagaimana kita memasukkan kawasan? Ada beberapa kawasan yang anda boleh memasukkan konten web secara langsung. Masalahnya, sebab kawasan terbaik sekarang, mereka memasukkan kawasan. Jadi kawasan kawasan akan memasukkan segala-galanya, dan kemudian, segala-galanya menu, kawasan akan memasukkan. Jadi ia akan memasukkan kawasan kawasan. Mari kita katakan, anda mencari artikel ini. Ini sedikit menu, tapi saya mencari anda untuk membuat ini dulu sebelum anda akan pergi ke Angkon. Jadi mari kita katakan anda nak ambil ini. Maaf, ambil ini. Saya akan membuatnya sejauh-jauh. Jadi anda boleh melihatnya. Jadi anda hanya mempunyai kawasan, bagi contoh, kemudian memasukkan di sini. Untuk data Angkon atau data teksual, anda tidak perlu risau tentang, anda tidak perlu risau tentang formating. Sejauh-jauh, sejauh-jauh kawasan semua dengan kawasan. Jangan memasukkan mereka. Jadi mari kita katakan di sini. Jika anda tidak perlukan detik orang, anda hanya memasukkan. Dan kemudian memasukkan, memasukkan segala-galanya. Kerana ini akan memasukkan data anda. Jadi memasukkan, memasukkan. Dan kemudian, untuk kemudian, anda boleh memasukkan seperti ini, tapi nanti saya akan tanya, atau anda boleh memasukkan segala-galanya seperti ini dulu, anda memasukkan nanti. Tetapi, menurut bagaimana cepat anda boleh bekerja di sini, seperti anda dapat melihat video icon ini, kemudian anda hanya memasukkan. Ini tidak memasukkan. Memasukkan, juga memasukkan, juga memasukkan. Oleh itu, anda boleh memasukkan segala-galanya dulu, dan kemudian memasukkan, juga memasukkan, anda tahu, seperti sebab star ini ada trend ini, mereka ingin memasukkan ini di antara. Kerana anda tahu bahawa anda menggunakan star, bagi contoh, sebagai pemerintah anda, kemudian anda boleh memasukkan, juga memasukkan, dan kemudian memasukkan hal itu kerana, ia bukan data terbaik anda. Data terbaik anda adalah artikel, dan juga cerita yang berlainan, anda perlu memasukkan. Jadi, ini satu artikel, bergantung kepada bagaimana anda mahu bekerja, beberapa orang akan membuatnya satu-satu, seperti sekarang ini adalah satu, jadi anda boleh melakukan, anda boleh memasukkannya sebagai star, itu adalah o1, maaf, o1. Anda boleh memasukkannya sebagai artikel, jika anda mahu, jika anda tidak mahu memasukkannya sebagai artikel, bermakna jika anda memiliki 1,000 artikel, anda akan memiliki 1,000 file tekst, jika anda tidak mahu, anda boleh memasukkannya dengan apa-apa adil yang anda mahu, seperti sebuah bulan, jadi semua yang diadil pada November, anda hanya memasukkan dengan satu file tekst, jadi anda boleh terus memasukkan, anda harus memasukkan, anda tahu, memasukkan. Dan kemudian pergi ke satu artikel, seperti yang saya cakap, saya tidak menggunakan kataklisasi, jadi saya hanya memasukkannya lagi. Baiklah, dan kemudian memasukkan, dan kemudian, anda tahu, memasukkan perkara yang sama untuk memasukkan data anda. Saya rasa ini adalah sebuah bahagian yang sedikit lebih tinggi, kerana jika anda menggunakan software untuk melakukannya, anda tahu, anda boleh melakukannya, tetapi kemudian anda masih perlu melakukannya, kerana data menggunakan akan menggunakan semuanya, ia akan menggunakan setiap tekst yang anda dapat melihat pada pakaian web, yang tidak bermakna, kerana anda masih perlu melakukannya. Jadi jika anda melakukannya seperti apa yang saya lakukannya sekarang, setidaknya anda boleh melakukannya, saya tidak tahu, bergantung pada masa saya, tetapi biasanya saya akan melakukannya sekitar dua jam, hanya untuk memasukkan apa-apa saja yang saya boleh dulu, dan kemudian saya akan melakukannya untuk melakukan sesuatu yang lain dan kembali dan melakukannya lagi jika anda mahu melakukannya. Baiklah, tetapi saya adalah, memasukkannya terhadap keadaan anda seperti ini, anda boleh melakukannya kerana ia memasukkan untuk web sekarang. Memasukkannya dengan baik-baik saja, memasukkannya dengan baik-baik saja, kemudian memasukkannya, kemudian kita akan melakukannya untuk Encon, kerana tanpa mempunyai ini, anda tidak dapat menggunakan Encon untuk melakukan apa-apa pun yang anda mahu melakukan, hal analisisnya. Jadi ini adalah satu. Saya mempunyai banyak kopi sampel di sini, terutamanya DMS dan juga Malay. Jadi hanya untuk memasukkan untuk anda hari ini. Tetapi dua cara, anda boleh melakukan analisis diskut anda, bagi contohnya, menggabungkan data anda sendiri, seperti Star, Meshikini, atau apa-apa saja. Atau anda boleh juga memasukkan kopi yang terseluruh. Saya rasa anda boleh mencari. Ada banyak-banyak kopi, seperti ada kopi yang berwarna di sini dan sebagainya. Anda boleh memasukkan dan menggunakan untuk analisis anda sendiri, atau anda boleh memasukkannya sebagai referensi. Sekarang, mari kita memasukkan Encon sekarang. Saya tidak pasti jika anda memasukkan, jika anda tidak memasukkan, kemudian anda boleh melakukannya nanti. Pertama, perkara yang saya mahu lakukan adalah melakukannya supaya anda dapat melihat. Saya akan pergi ke, minta maaf, pergi ke setting, setting global, font, saya akan membuat font lebih besar supaya anda dapat melihat. Baiklah, anda boleh mengubah font-size jika anda mahu. Jadi, ini adalah versi baru, 4.2.4. Jika anda mempunyai versi yang lebih awal, saya menghargai anda untuk mengubah, kerana analisis tersebut lebih baik dalam versi 4.2.4, jadi anda cuba menghubungi versi ini. Sekarang, anda perlu memahami dengan interface software dulu. Ia nampak susah, tetapi ia sebenarnya sangat cepat. Anda mempunyai kawasan target, 0-0-0, tidak ada apa-apa di sini. Kawasan target adalah kawasan yang anda mahu mengalami. Untuk contoh, jika anda melakukan analisis kawasan ini pada sebuah teman di pabok, itu akan adalah kawasan target anda. Jadi, anda menghubungi semuanya dulu, dan kemudian anda akan menghubungi. Jadi, ada banyak cara untuk menghubungi kawasan. Jika anda pergi ke kawasan, ada kawasan tersebut sebagai kawasan cepat. Jika anda klik pada kawasan ini, anda akan menghubungi kawasan anda segera. Baiklah, saya katakan kawasan ini, dan kemudian ia akan menghubungi. Yang ini, saya tidak menghargai anda untuk melakukan ini, kerana jika anda melakukan kawasan cepat, setelah anda menghubungi, setelah anda menghubungi and gone, kadang-kadang ia tidak selamatkan apa-apa pun yang anda perlu katakan. Jadi, saya lebih suka bila-bila anda mahu menggunakan and gone, pergi ke kawasan kawasan. Jadi, hanya menghubungi kawasan kawasan. Saya sudah ada beberapa di sini. Jadi, setelah anda menghubungi kawasan kawasan, ada kawasan kawasan kawasan, raw file dan wordlist. Tiga kawasan kawasan kawasan yang anda sudah dapat melihat, pula-pula, anda. Kawasan kawasan kawasan yang diberikan oleh ancon. Ancon menerima kawasan kawasan 2006 dan kawasan kawasan kawasan 2006. Jadi, kawasan yang ada di sini, biasanya kita menggunakan kawasan kawasan kawasan yang dipercayai untuk dibandingkan. Jika anda mahu menemukan, bagaulah, kawasan kawasan kawasan kawasan kawasan yang diberikan di kawasan kawasan kawasan itu, anda dapat melihat. Mereka mempunyai kawasan, kawasan kawasan, kawasan kawasan, kawasan kawasan, dan kawasan kawasan. Adakah kawasan kawasan kawasan kawasan kawasan yang diberikan oleh ancon? Jadi, saya menghubungi kawasan kawasan. Jadi, apa yang perlu anda lakukan? Saya akan kata anda mahu menerima kawasan kawasan dengan kawasan yang diberikan oleh ancon. Mari kita tekan. Kamu hanya perlu klik di sana. Pilihnya. Pilihnya. Jika kamu melihatnya, bermakna ia tidak di EnCon. Pilihnya. Klik Connect online. Dan kemudian klik Update. Dan kemudian kamu akan tanya, kamu pasti? Jadi, ya. Kemudian ia akan menghubungi 5 MB kawasan. Jadi kamu ada kawasan kamu siap. Jika kamu pergi ke list kamu, kamu akan melihat kawasan. Jadi, kawasan diketahui. Kawasan diketahui yang kamu ada di database kamu. Sekarang, jika saya akan... Tunggu. Okey. Sekarang, ini adalah database kawasan. Apa-apa pun yang ada. Kawasan kamu sendiri. Dan juga kawasan tersebut yang dipergahakan di EnCon. Ini satu cara menggunakan. Tapi, saya rasa yang paling kita akan buat adalah kedua. Kawasan raw. Kawasan raw bermaksud, seperti yang saya lakukan tadi. Kawasan dari kawasan, kawasan kawasan. Jika kamu membuat transkripsi, kamu transkripsikan semua pembinaan. Kata-kata. Ini adalah tempat yang kamu membuat. Jadi, kawasan raw. Dan nama dengan baik. Tiada kawasan. Kamu boleh menggunakan underscore, tetapi tiada kawasan. Contohnya, ini adalah kawasan. Saya hanya menggunakan, kawasan. Saya mencari artikel dari kawasan untuk menggunakan. Jadi, saya hanya menggunakan nama seperti ini. Kawasan raw bermaksud. Kemudian, saya perlu menambah pembinaan saya. Kawasan raw bermaksud yang saya tanya kepada kamu sekarang. Jadi, menambah. Mencari kawasan. Saya ada kawasan raw sekarang. Kemudian, saya boleh menambah kawasan yang lain. Kawasan raw. Jika kamu mempunyai 10, 11, 100, menambah. Tapi, pastikan kamu tahu semua kategorisasi ini. Jadi, kamu boleh menggunakan artikel. Kamu boleh menggunakan date. Kamu boleh menggunakan month. Kamu boleh menggunakan themes. Mereka bergantung. Jadi, kamu boleh menambah sebanyak yang kamu mahu. Jika kamu mahu, kamu boleh menggantikan dalam satu folder dan kemudian menambah kawasan. Dan kemudian kamu akan menambah kawasan. Jika saya mahu menggunakan kawasan raw bermaksud. Jadi, saya hanya menambah di sini. Dan kemudian saya hanya menambah kawasan. Kamu akan menambah kawasan raw bermaksud yang saya ada. Jadi, kamu tidak perlu risau tentang yang lain. Basis kawasan, seperti semua kawasan ini, mereka sudah selesai untuk kamu. Jadi, kamu tidak perlu mengubah apa-apa. Jika nanti, kamu lebih suka membuat analisis lebih tinggi, kamu boleh bermain dengan kawasan ini. Untuk sekarang, kamu tidak perlu melakukan apa-apa lagi. Kami akan menambah kawasan. Kamu dapat melihat kawasan yang telah dilakukan. Jadi, apabila kamu menambah kawasan, kamu akan mempunyai kawasan kawasan sebagai kawasan kawasan. Kawasan kawasan kawasan. Jadi, kamu dapat melihat kawasan kawasan. Maaf, kawasan kawasan kawasan ini. Saya mempunyai kawasan 3903. Kawasan kawasan mungkin seluruh. Ada beberapa kawasan kawasan kawasan. Pada bagaimana kamu mempunyai kawasan kawasan. Jadi, kamu perlu melakukan kawasan. Tapi, kamu ada semuanya di sana. Sekarang, apa yang kamu perlu berhati-hati pada kawasan ini adalah kawasan kawasan kawasan dan kawasan kawasan. Jadi, apa yang kita telah memasuk sekarang adalah kawasan kawasan kawasan, kawasan kawasan kawasan yang kita mahu analis. Jadi, saya akan pulang ke kawasan kawasan kawasan. Kemudian, kamu akan melihat satu-satunya kawasan kawasan kawasan. Baiklah. Sekarang, kita boleh mulakan bermula dengan kawasan kawasan ini. KWIC adalah kawasan kawasan kawasan. Bersama, kawasan kawasan kawasan. KWIC kawasan kawasan bermaksud kamu cuba mencari bagaimana kawasan kawasan kawasan dalam konteks. Jadi, ini menakutkan jika kamu mempunyai kawasan kawasan kawasan yang kamu mahu melihat. Terdapat alasan kecuali. Bersáu, kamu bakar untuk alasan yang ingin dilahirkan. Vocês sudah ada alasan yang ingin dilahirkan. Baiklah, kata-kata 20 alasan yang kamu mahu mencari. Kemudian, kamu boleh menguriti mereka apabila ke hutup kawasan capital. Bersama seperti apa-apa pun. Baiklah, saya mahu mengawas alasan kawasan. Jadi, saya perlu berbual bahawa saya tidak perlu mengawasi apapun. Alasan kawasan kawasan akan lebih kawasan. Alasan kawasan kawasan hanya menentukan alasan yang di-ac pawn. jadi jika anda melihatnya, ia akan melihatnya hanya untuk kes yang tinggi atau kes yang tinggi, baiklah redgex bermakna semua kombinasi, jadi jika anda melihat untuk menggabung, ia akan menggabung untuk kegabung, kegabung, semua ini, ia akan melihat untuk semua jenis kombinasi yang boleh menjadi pengetahuan, jadi biasanya kita tidak menggunakan ini, kemudian keputusan itu anda boleh pergi untuk semua hit, anda boleh pergi untuk top 10, top 50, 100, bergabung, tetapi kita tidak pergi untuk melihat semua ini dulu, keputusan konteks ini biasanya adalah top 10, konteks bermakna sebelah dan seterusnya, saya rasa anda akan melihat apabila saya klik mulut, saya mungkin saya klik mulut, anda dapat melihat konteksnya jika ada konteks yang tinggi, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 10, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 10, jadi jika anda mahu konteks lebih lama atau anda mahu melihat konteks, anda hanya bermain dengan ini, mari kita lihat anda tidak mahu begitu lama, anda hanya mahu melihat konteks dalam 5 keputusan atau 5 keputusan, klik mulut, anda akan melihat keputusan konteks, tapi biasanya 10, saya rasa ia sangat bagus, jika anda melihat konteks ini, anda mahu melihat konteks ini, kemudian anda akan melihat, menurut kebebasan, jadi mari kita kata anda mahu melihat menggunakan keputusan konteks dalam kompalasi konteks yang anda ada daripada star, anda dapat melihat bahawa keputusan konteks adalah gila-gila digunakan untuk produk menggunakan, produk menggunakan, blah-blah-blah, tapi anda dapat melihat kerana keputusan, bagaimanapun, dan kemudian anda dapat juga melihat perkara lain, tentu-tentu jika anda melihat keputusan ini, ia cukup terbiasa sebab saya hanya melihat perkara lain untuk berbagi tentang produk yang baru untuk PNR 2023, tetapi anda dapat melihat semua sorts, 당신 boleh mencari biasanya atau biasanya, tetapi kadang-kadang jika anda mahu melihat sebuah kiri ini, anda tidak mahu melihat di konteks yang terbaik, anda hanya mencubat pilihan dari senjata ke Popul dan mulut, sebenarnya, ia akan mencubat kegerangan. So, obviously for this database or corpus that I have, it's all anti-smoking, anti-smoking, blah-blah-blah because of the context. So you can see how it's organized. This is for keyword in context. Now the beauty of Encon is once you load it and you search for this one, you can play around and click on it, then you can see it's used in the article itself. Now I can see how it's used. So let's say you notice this one, you can just double click on it and then it will show you exactly in the corpus that you have. So let's say if you're reporting for your studies, you can just extract it as your excerpt. Take it out and put it as your excerpt to prove how smoking is used or you can just show the whole table. Like maybe top 10, this is 1 to 51. You can reduce it if you want to. You can reduce it, let's say top 10, alright, or maybe top 50, depending on how you want it. How do you copy? Encon, the previous version, allows you to export as, how to put it, export as a text file. You can see, don't be overview with this one. This is export setting, nothing to do with the data. So if you want to save this one, it's under this one now, save current tab result. If you click on this, it will save as the KWC result and then TXT. Let's say I try to save this first, so that you can, it will be like this, right? Then you will know the file. But not that nice. So what we normally do is you can just click this top left, just like excel, top left, click it, it will highlight everything. If you want to see all, then put all hits, highlight this, copy, go to edit, copy, or control C, open your Microsoft Word. If you want to, or excel, that's even better. And then you can copy the whole thing, right? Of course, this one you have to change the orientation a bit. Okay, so this is, this is how you kind of copy, extract, or if you want, you can also open excel and then just, you know, paste it. Of course, you have to adjust all the, all the, you know, all the things manually. Okay, because the export for Encon is always text file, TXT, so it doesn't keep the formatting. So if you want to keep the formatting like the colors and everything, then you have to copy and paste to a Word document or of excel, right? Something like this. I think Word document will be quite, quite easy. Obviously, because my font is bigger in Encon, you can resize accordingly first before you copy. What I mean here is this. Before you even copy all this, you might want to go to setting, global setting, and then under font, you change according to your, your, the font that you like first. For example, Times New Roman and the Times New Roman, font 12, change it first before you copy because it's easier. You don't have to change the formatting later because later on, if you go to Microsoft Word, when you highlight everything and you try to change the font, it doesn't work sometimes, not all the time, but, you know, it may happen. Okay, that's one. This is under keyword in context. Now, if you go to plot, I'm using the same data. I'm using the same Word again. Plot here means it will, if you have more than one list here, like I have one and two, or if you have 10, it will detect the usage of the Word in terms of is dispersion according to your copper size. For example, let's say I just start first. You can see I have two set of data here, the star one, the star two. So, from the plot itself, I can see that smoking appears more in the first file. It doesn't appear much in the second file because I'm searching for the word smoking. This word, it's frequently used in the first one because of the token, and then the frequency is 41. And then you can see the dispersion is spread out across whatever you have For the star two, it's only used, you know, maybe randomly or at certain lines and only. You can see the dispersion. The plot may not be useful for your case, maybe, but if you have a lot of articles, if you compile by articles, then you can see how the Word is used across articles. So, it's kind of interesting to also visualize this. So, you can see the dispersion is 0.8, 0.4, means the higher, means the more is used across. If you go by article, then it's meaningful because you can say that the word smoking is widely used in that article, not in the second one. Assuming that you have one article and second article, and blah blah blah, you have 10 articles, then you can do this kind of comparison. And it gives you a nice visualization of how the word is spread out across the article. If you want to see how it's used, you just click on it, and then it will show you all the detection. Like, this line alone has one, two, three, four, five. Five. The word smoking is used five times in this line alone. I mean, that's an explanation for the plot. Okay. I'm not sure if you have used this before, but normally this plotting visualization is used for multiple articles or multiple copies comparison. Then you can see the usage of the certain words in certain context. For example, another example would be dialects. If you have like 10 dialects comparison, you want to search how is used, a word is used across dialects. Once you search, then you can see the dispersion. Then you will notice that, oh, maybe in that dialect, the word is not used at all because it will be blank. Here it will be totally blank. If you don't like the color blue, you can change the color to another color and whatnot. Okay. Any questions so far? So you can see the same dataset can be used for keyword in context. Now I'm moving to plot. Okay. And then the plot, of course it will still show you the frequency. So the word smoking is used 41 times in this file, only 10 times in that file. So obviously the distribution is higher in the first one. All right. File view is exactly the file that you have. For example, if I have two files here, if you go to file view, then you will see the exact view of the whatever corpus you have. So which is why when you copy all this into your text file, you have to be very careful so that you don't copy something that you don't need or something that it's beyond your scope of analysis. Okay. So file view is what you see. So normally whenever you see all this keyword in context, if you double click on the word, you will always go to file view. You can see here is move to file view. All right. It will move to file view because you can check house is used in that context itself. Okay. All right. You know, just in case you're curious, you can see like for example here, the control or the control just in case you're curious why, you know, it's obviously you know why here because it's the name of the bill. But in case you're curious, say you can just double click and then it will bring you to all these excerpts. All right. And whenever you want to go back, you can just go back to keyword in context and then find it again. Okay. This is left context. This is right context just to repeat what I said just now so that you see how it changes. Now the font size changes because I change the font size just now, never mind. But I hope you get this point. Keyword in context is useful if you are searching for specific word list. Like previously, some of my students were doing emotive words in Instagram caption and all that. So they compile all the captions but they have the word list already like all the emotive words that they want to find so they find one by one and then they compile it. Then you will see how the emotive words are used in all these Instagram captions for example. But you have to compile all these first in your how to put it text file. There were some student who came to see me and say you know, can you just extract that early? For example, unfortunately you can't. I mean, no way you can just give the link and then everything will be done for you. You still have to do your manual job because you are the one who is going to decide which posting, which caption you want to take. Right. At least the analysis part is easier for you because you don't have to manually do the coding or highlighting the words manually. Okay. For view cluster. Any questions so far? Just in case. Before I go to cluster, these are one, you know, these two are related. Cluster, engram and collocate are related as well. No, ya, no question. Okay, let's go to clustering as the name suggests. Clustering is good. It's similar to engram and even collocate. It's good if you want to find clusters or words like when you check for the word smoking, you want to know what are the combination. Right. So if you go for smoking, if I just start now, you will see smoking product is widely used. Smoking bill is, you know, second smoking all, blah, blah. You can see how it's tested. Right. If you prefer three three words or three tokens, then you put three and then start. Right. Smoking, product four, blah, blah, blah. Obviously, because of the word smoking, normally we go for two words because, you know, like you just want to find, but it depends on what you are looking for. If you're looking for more, then go up the cluster size, but normally it's between two to five. Right. So let's say I go back to two. So at least I can see how it's used based on the frequency count. My my copper size is not that big. Obviously for the star because I just randomly compile all these articles. So you can see the the range is not that big as well. You know, the the the frequency is not that big, but you get the point of using clustering. Once you load it up, then you will see the clustering. Or maybe I can load something bigger. Let me just go to corpus manager now. Go to corpus database. I'm going to load the American English database 2006. Where is it? Yeah, the academy English one. Okay. I'm going to load. You can see the this one has more. One file to 80. Let's say I search for the usage of however. All right. Just want to find out whether they use this. So just start. Then you can see because he's higher and then however, and blah, blah, blah. Or you can say we maybe see whether personal pronouns I use. We then we have we are this are clustering. Okay. But this data is no longer the data that we use just now the smoking one. This is American English 2006 corpus. So you can play around with with whatever corpus you want for now. Okay. At least you you know what it means. So you can have bigger cluster size if you want to. But depending on what you're looking for, then you can increase this and then click start again and then you will rerun it. Okay. So cluster and Ngram are the same in a way because Ngram means how the words I use in terms of you know, one gram by gram and trigram means let's say I just click start. Same thing you can see it's quite similar. Right. Because this one is two Ngram size two. So if I go for three you will see similar data. Right. It's just a different name because Ngram it comes with the how to put it. The token comparison. Right. You can see here Ngram token five to three blah blah blah but if you're not using Ngram then you don't have to bother about this because clustering is enough. Right. Some people they they they they're using Ngram analysis so you might want to use the Ngram version but you can see similar. After all, the meaning is the same anyway because it's looking for the recombination of the usage of the word. Right. Whatever you're looking for here. Okay. Colocate. This one is like concordance plus Ngram if you go start. Right. You can see collocate means the word that normally being used with we. Right. But not like this. We have and all that but you can see C and we are quite close. Like it would is 75. The higher the likelihood means the higher the chance of you looking at we and C together. Of course we is there. Right. The like the association of all these words. No. No. Ourself. What? Blah-blah-blah. So the higher the likelihood means the the closer it is with the the word they're looking for. Let's say if I search other words what are the words maybe books I'm not sure whether it exists in the yeah. So you can see because of academic list likelihood of the word this is higher means probably we use this book this book all the time. So the collocation size is higher. The likelihood is higher. Right. You can also see the frequency. Left right. Left right. Left right means the before and before and after. Left is before before the word before the word book. You can see this is used before then after right because the right is after the word book. Okay. So collocation is quite useful as well at times to see how certain words are being associated with other words. So again depending on what you're looking for in your analysis okay. Word. Wait. Cluster, engram and collocation. Any question? Just in case. I'm not sure if you're using this but it would be useful when you encounter some strange usage like previously one of my students were doing on slangs. So we encounter some weird slangs that we have never heard before. So we run the the class engram and collocation just to check how it is used just to get the meaning a bit and it will show you like okay that word is often used only with these words that kind of usage or maybe you can also detect the usage of the word by by feel right. If you're looking at medical feel for example then certain words are used more in those kind of text medical text or medical medical articles if you compare with normal magazine maybe you don't see the collocation so you can do comparison as well. Okay. Next one is word this is the most simplest the one that people use a lot is just to check the frequency of the words meaning you don't have to search this one just leave it blank right. Just leave it blank let's say you want to find the frequency of any words used in all this you know corpus just click start obviously in English the word der is the highest right. So the frequency is 10,000 more than 10,000 times then off and to blah blah blah so it will go by the top 10 usage or top top 50 okay. This is for of course academic if you have different set of data you can search it right you can search the word itself let's say I'm not sure whether I can search book again right then you will see it's rank number one obviously but it's only 97 times but this one you don't get to compare because you are limit you are limiting it by only one word right but for frequency count normally we will go for blank and then search everything right what we normally do of course will be copying all this copy and then go to excel if I start anyone paste right you will get your you will get all this range and everything this one POS we don't have yet just delete then you will have the the rank like the is use how many times blah blah blah then you can delete the one that you don't want all right or in your encode itself you can go for advanced query and then you can only you can tick this one and search only for certain words but this one will be limiting same thing like what we did just now same thing like what we did here you know search certain words only but it will be limiting right yeah depending on what you're looking for in this case again because the tool is there but you can see x is there probably will be wondering why x is there so you can double click on this but no search term because it doesn't detect where it is not sure why maybe it could be you know the like x-something all right x-mers or something but it's not it's not loaded in the database maybe i load our simpler one easier for you to see let's let's try let's try Malay Malay corpus i have quite a number here let's say go for Malay KL1 just go for Malay 1 and then this one is KL VM all right i'm creating a new one so you have to create then you will load a new one now every time you want to load a new new database you have to create one first right using raw file means you you create your own corpus database is what we have created or what we have downloaded you can see now we have created one KLBM now raw file is you know the one that we normally do we just compile everything in text file and then put it in okay return to main menu so i have all my new KL1 now so when you want to look maybe cow right search you can see even in the Malay corpus the word there is highly used right and then done sayah yang to ikan gaga all this are Malay words you can see there this is slang by the way this is Malay KL Malay lah you know KL Malay so there's a mix of all this the sayah and all this so you can still search and if you want to see how it's used maybe load this one first oh yeah why is it oh okay oh yeah remember not to don't forget to uncheck this because every time you check this because i didn't put anything here so you won't find anything so uncheck this one first search then you will see how it's used i don't know where i think the start is still here i didn't remove it just now all right let's say kau only one all right tadi saya all right saya then you can see saya telah saya rasa you know instead of lah blah blah you can see the usage here all right so if if you see the word frequency i load it again is one three six but if i remove sayah start then you get the whole list then you'll be wondering how come in Malay corpus you have there because i think it's not the Malay corpus is this two just now i i forgot to delete all right but let's say done click double click on it then you will see done all right and same thing just now same concept so you will see how the word is used the right contact is the you know after the word left is before the word so you need to see before and after then you get an idea how how the words are used but this is aligned by right if you want to see before and then click sort to left you will see how the word is used before all right gargah i don't know why yeah because this is i think the data is Tritalisan it's a folktale but but but then told by the Malay in KL all right so so the the spelling is a bit different okay all right so if you need to check the whole the whole context is i'm sorry yeah if this can it be a phrase like rather than words you can can can they say makan nasi if you try to search if it exists lah no let me let me try okay makan ikan okay makan ikan then you can makan ikan okay you can you can search you can search just more than one word okay depending on what you're looking at but normally we go by word this okay this is this is purely searching based on existing words that you want to find out like like if you know you want to find verbs that you can probably search all the words but if you don't want then just click start sorry just click how to put it something okay something makan you can put the astrid or makan something obviously it will it will just put everything there already you can put the wildcard if you want to this is wildcard or i don't know whether ikan ada yeah you can put the astrid for wildcard means any combination but because i will copesize somehow makan ikan saja so you can't really see you can play with the astrid so you can find any combination or makan something doesn't have to be doesn't have to be ikan but in in our case because makan ikan sebaiknya lebih betul jadi anda akan melihat makan ikan lebih di sini okey ya ini ini adalah kata kata dengan bagaulah bagaulah kata kata yang ini seperti kata okey untuk kata yang ini ia bermaksud anda mempercayai kata dengan kata yang lain baik jadi ini sedikit teknikal sekarang jika anda jika anda jika anda pergi untuk pembangunan kata saya akan mempercayai ini dulu saya akan mempercayai mempercayai dua ini dulu betul ini adalah ini adalah kata saya menerima saya rasa biar saya mempercayai database supaya lebih mudah kita cuba membeli kembali ke yang mengandung lebih mudah untuk anda mengandung yang dan kemudian kita katakan anda mahu memcompare ini adalah kata yang dipercayai anda dapat melihat tab yang di sini kata yang dipercayai ini adalah yang yang anda ada kita katakan anda mahu mempercayai dengan satu lagi kata seperti kata yang dipercayai seperti kata jadi pergi untuk mempercayai kata sekarang adalah telur kerana anda tidak mempercayai apa-apa kita katakan anda mahu mempercayai dengan sebuah bahagian amerikan sekarang baik-baik-baik di kata amerikan atau sebuah ini tidak sempurna oh iya saya belum melihat lagi yang ini di sini ya siapkan pastikan ia siap-siap berdua klik dan kemudian anda akan melihat di sini ialah kemudian anda akan melihat kata yang dipercayai adalah anda kata yang dipercayai adalah yang anda berusaha untuk yang anda mahu mempercayai iya mari kita katakan saya mempercayai kata ini dengan bahagian amerikan akademik jadi anda akan melihat dua kata yang di sini kata dan kemudian kata iya sekarang tidak iya sekarang anda tidak melihat ini kerana anda tidak mempercayai apa-apa ini adalah berguna jika anda mahu melihat kemungkinan dari apa-apa pun yang anda ada dalam kata-kata anda dalam perjalanan dengan beberapa kata-kata lain atau kata-kata yang anda ada anda mahu mempercayai mari kita katakan jika saya mencari kata ini saya hanya klik mulut kemudian anda dapat melihat dalam kata yang dipercayai mempunyai lebih sering dalam kata yang dipercayai T.A.R. untuk kata yang dipercayai tetapi hanya mempunyai berdua dalam kata yang lain tetapi kemungkinan ia tinggi kemungkinan yang lebih tinggi ini adalah sangat-sangat penting dalam kata-kata yang kita ada dalam kata-kata target sangat penting seperti ia adalah kata-kata yang digunakan dalam kata-kata ini seperti yang berkumpul kepada kata-kata yang dipercayai bermakna ia tidak menghargai kata-kata yang dipercayai ia seperti ini jika anda melihatnya rendah jika jika kemungkinan yang rendah bermaksud kemungkinan anda bukan kemungkinan yang benar bermaksud ia segera dipercayai dalam kata-kata ini kata-kata yang terkenal akan ialah kata-kata yang jemput kemudian anda mempercayai dengan anda sudutnya anda merahat kemungkinan sangat tinggi untuk sebuah dunia seperti tidak terlalu tinggi adalah sangat tinggi untuk contoh jelas artikel yang anda mempunyai anda mempunyai bercakap tentang mempunyai lebih daripada sebuah segera jadi anda anda boleh katakan bahawa anda tahu artikel ini sangat terkenal untuk sebuah segera atau sebuah segera anda tahu maksud saya sebuah segera seperti Malaysia juga lebih di sini kerana ini adalah bahasa inggeris amerika jelas apabila segera tidak ada banyak bahasa Malaysia atau bahasa covid terdapat tapi anda dapat melihat ke bawah beberapa kata yang penting seperti baik dan semua seperti sebelum kemungkinan lebih di-referensi segera ini adalah segera itu bermaksud kebenaran kebenaran kebenaran lebih tinggi untuk kebenaran atau kebenaran kebenaran ini bermakna yang paling berkesan adalah kebenaran kebenaran yang anda terserangkan Tuget Kopers seperti Kopers, bukan Kopers yang anda menyebabkan. Tapi ia betul-betul bergantung dengan pergantungan anda juga. Jika anda bergantung lebih-gantung, atau lebih-gantung dengan pergantungan anda, mari kita katakan jika anda bergantung dengan pergantungan yang benar-benar, seperti CEFR, CFR, Komponent Return Framework, anda ingin bergantung dengan C1 dan C1, tentu-tentu yang akan lebih rendah kerana ia sepatutnya bergantung. Tapi mari kita katakan anda menyebabkan ia bergantung, apabila anda membuat pergantungan ini dan KON untuk pergantungan alas, keadaan keadaan keadaan sangat tinggi, bermakna sebab satu perkara yang anda gunakan di semua tukaran anda, ia betul-betul. Betul-betul seperti ia boleh menjadi baik, boleh menjadi baik, atau boleh menjadi terdapat dua perkara yang dipergantungan dengan sebab artikel anda, tetapi tidak di CFR yang bergantung. Untuk contohnya. Jadi keadaan keadaan keadaan keadaan keadaan, anda tahu, yang lebih terkenal adalah ini. Tentu-tentu anda dapat melihat semua tukaran-tukaran ini, ia sangat terkenal dengan artikel-artikel, kerana artikel-artikel yang saya memcompilkan semua tentang keadaan keadaan di Malaysia. Baiklah. Baiklah. Ada pertanyaan sejauh ini? Boleh saya? Okey. Manika tanya, untuk perkara, boleh saya mencari lebih daripada perkara yang lebih daripada satu kali? Seperti Kami dan Kita pada masa yang sama. Anda perlu buat satu-satunya. Ya, anda perlu buat satu-satunya. Jika anda mencari beberapa kali, jika anda melakukan lebih daripada satu kali, kadang-kadang ia akan menjadi quite confusing, kerana anda akan menghentikan perlukan yang berbeza. Baiklah, ia lebih baik untuk melakukan satu-satunya. Saya harap saya akan beritahu itu. Workcloud adalah pilihan yang terbuka. Saya rasa ini tidak menggunakan. Mereka hanya mempunyai Workcloud dari wawar-wawar untuk versi ini. Jadi Workcloud bermaksud, apa-apa yang ada di sini, saya katakan ada satu di sini. Saya katakan ada satu lagi, pilihan yang menggunakan. Wawar-wawar, wawar-wawar, ia dapat mengubah keadaan. Baiklah saya mahu mempunyai Workcloud untuk peralatan dalam konteks kwic. Saya hanya klik mulai dan kemudian ia akan mengubah Workcloud pada pilihan di sini. Wawar, ia berbuka kerana saya mencari kota berbuka. tetapi jika anda mahu pergi ke frekuensi, anda boleh menghidupi kemahiran dan mulai, mari kita katakan anda dapat semua ini, alat ini, anda pergi ke pejabat, berubah ke wad dan mulai, kemudian anda dapat melihat diri lebih besar, kerana dalam rangka anda diri adalah nomor satu, dua adalah nomor dua, tetapi saya tidak fikir ia berguna, tiba-tiba saya tidak benar-tiba suka kemahiran wad, tetapi hanya beritahu anda bahawa ia berguna, anda boleh mengubah kemahiran dan segala-galanya jika anda mahu, dan kemudian mulai lagi, anda akan mengubah kemahiran wad. Mungkin lebih berguna jika anda menghidupi kemahiran wad, mungkin lebih berguna jika anda ada itu, tetapi saya rasa jika anda mencari kemahiran top 10, mari saya pergi ke top 10, jika saya akan pergi ke top 10 di sini, sekarang ia semua berguna, sekarang ia top 10 saja, jika saya klik mulai lagi, dan jika saya pergi ke wad, kemudian saya dapat ini, bukan itu bermakna. Baiklah, tetapi hanya untuk beritahu anda bahawa ia ada di sini. Jadi kita mempunyai kemahiran dalam kontak, plot. Plot adalah berguna jika anda ada lebih daripada satu, jika ia hanya satu, plot ini tidak akan menjadi terbaik, tetapi jika anda ingin melihat dispersion, file view adalah di mana anda melihat file, clustering, lebih daripada satu wad, ngram 2, tiga ini adalah sama, tergantung pada apa mekanisman yang anda mencari, kerana ngram anda akan mengikuti format ngram, collocate sesuai akan memberi anda lebih banyak wad daripada kombinasi secara langsung, bermakna wad yang sempurna pada wad sebelah dan seterusnya, dan wad adalah wad kemahiran, terutamanya wad kemahiran, wad usage, wad kemahiran adalah untuk mencari kemahiran wad dalam wad yang lain, untuk mempunyai kemahiran wad dalam wad kemahiran dalam wad yang lebih daripada satu wad, dan kemahiran wad, okey, ada pertanyaan sejauh ini, ada pertanyaan sejauh ini, hanya sejauh ini. Helo doktor, saya ada dua pertanyaan di sini. Pertama, saya akan menghubungkan file pdf atau file wad dalam Nconk. Okey, untuk file pdf, sebenarnya anda boleh menggunakan wad lagi, tapi kemahiran adalah untuk menggunakan text, txt, kerana adalah cleaner, kerana jika anda menggunakan wad, kadang-kadang apabila kita mempunyai konten Microsoft Word, anda akan menghubungkan semua wad yang digunakan, web saps, krip atau apa-apa pun, jadi anda akan mempunyai perkara yang anda tak nampak, itu yang bermaksud saya. Jadi jika anda menggunakan file wad, file wad akan menghubungkan semua wad yang digunakan dan hanya wad yang digunakan. Saya bermakna seperti di sini, anda dapat melihat file wad adalah cleaner. Jika anda menggunakan wad, anda akan mempunyai segalanya, termasuk tabung dan segalanya, apabila anda menggunakan wad pada Nconk, anda masih boleh membaca, tetapi kadang-kadang anda akan menghubungkan beberapa perkara yang anda tak perlukan, tetapi anda boleh melakukan itu. Jawapan adalah boleh, tetapi tidak dapat dihubungkan. Saya harap anda dapat kawasan saya. Terima kasih. Pertanyaan kedua adalah jika saya mempunyai wad yang digunakan dengan wad yang digunakan, sebaiknya, jika saya mempunyai wad yang digunakan lebih dari 200 file, dan wad yang digunakan hanya 50 file, adakah ia dapat digunakan? Ia dapat digunakan, tetapi anda dapat melihat wad yang digunakan. Wad ini, wad yang digunakan akan lebih tinggi, kerana jelasnya wad saya lebih kecil. Apa yang berlaku adalah, ia masih bergerak menurut wad yang digunakan, tetapi anda dapat melihat wad yang sedikit rendah-rendah tinggi, kerana wad yang digunakan atau wad yang digunakan adalah berbeza. Jadi jika anda ingin melakukan wad yang digunakan, anda akan pastikan bahawa wad yang digunakan dan wad yang digunakan adalah sempurna dalam wad yang digunakan. Untuk membuat wad yang lebih kecil supaya ia tidak nampak begitu besar, anda akan pastikan wad yang digunakan adalah berbeza. Tapi jika anda tidak mahu, jika anda tidak mahu, bermaksud anda memiliki berbeza yang berbeza, anda dapat melakukan wad yang digunakan seperti yang saya lakukan di sini, ia hanya bahawa berbeza yang berlaku akan menjadi lebih besar, tetapi ia tetap berlaku sebab wad yang digunakan. Jika wad yang digunakan adalah yang sama, saya ada 16,000, minta maaf, 161,000 wad yang digunakan di sini, dan jika saya memiliki 160,000 wad di sini juga, wad yang digunakan akan lebih kecil kerana, tidak, tidak, tidak, maafkan saya, maafkan saya, wad yang digunakan akan lebih kecil, mungkin sekitar sekitar 20 atau 18 wad, kerana wad yang digunakan adalah quite similar. Atau nanti anda boleh cuba, jika anda meletakkan wad yang sama, anda akan nampak bahawa wad yang digunakan akan lebih kecil. Wad yang digunakan masih lebih kecil, tetapi masih wad yang berbeza, bagaimanapun. Apa yang saya bermakna di sini adalah seperti ini, ia masih beritahu anda yang sama, wad yang digunakan masih sangat berbeza, tetapi apabila anda meletakkan, kemudian ia nampak sangat rendah-rendah-rendah-rendah-rendah-rendah-rendah-rendah-rendah kerana wad ini lebih besar. Baiklah, dapat saya? Jadi anda boleh meletakkan, tetapi apabila anda meletakkan, anda mungkin mahu, anda mungkin mahu menggantikan kenapa panggilan ini sangat besar. Pada lebih kena, panggilan besar, panggilan kecil, kebenaran atau kebenaran, tanpa usaha wad yang sangat tinggi, tanpa wad yang sangat tinggi. Okey, saya lihat. Apa yang kita berlalu, kenapa yang membuat Oh, apa yang boleh diberi kepada kami? Kenas efek, mari kita pergi ke set-2. Jika kita pergi ke set-2, jika kita pergi ke keyword, jika kita pergi ke set-2, jika kita pergi ke set-2, jika anda pergi ke istimewa efekt desa ini, anda akan ringkan canyol empat dua ketamgu pengurangan, supaya sindara begged kanchanlahpol Pencuni. Sampai, jika anda harus periksa singer вой tanah dibuat. mempunyai sebuah kawasan yang lebih besar yang berkawasan daripada diri anda. Yang mereka menggunakan adalah 4 termasuk, tetapi sebuah kawasan yang lebih berkawasan adalah kawasan-kawasan log. Yang ini lebih teknikal, beberapa orang pergi untuk kawasan, beberapa orang pergi untuk Z-Score, tetapi sebuah kawasan yang sama. Apa yang berlaku adalah kawasan berkawasan bermaksud, ia cukup berkawasan dengan keperluan, sehingga kawasan ini merupakan untuk kawasan kawasan yang lebih besar, mari kita pergi dengan kawasan berkawasan, boleh saya pergi dengan kawasan? Ya, kawasan, jika anda pergi dengan kawasan berkawasan, maksudnya, mereka menggunakan kawasan lebih besar yang lebih besar yang lebih penting adalah kawasan dalam kawasan, ya lebih penting adalah ia digunakan dengan gila-gila dalam kawasan yang anda menggunakan, atau kawasan yang anda menghadirkan. Baiklah, dalam kes ini, kerana kawasan saya semua mengenai berkawasan, jelasnya, kawasan berkawasan itu harus menjadi kawasan yang lebih besar dengan keperluan yang lebih tinggi. Jika saya mengambil kawasan berkawasan, jika anda mengambil kawasan dari kawasan anda, sebenarnya kawasan anda sudah hilang dalam cara seperti, bagaimana saya minta? Sebab ia adalah mengambil kawasan, jika anda mengambil kawasan berkawasan dari semua kawasan, ia bermaksud, kawasan yang seluruh akan tidak lebih lama mengambil kawasan atau mungkin sesuatu yang seluruh. Saya tidak tahu apakah anda dapat saya, okey, seperti ini. Apabila anda mempunyai dua kawasan, boleh menjadi satu kawasan generik, boleh menjadi sesuatu, betul? Dan kemudian satu adalah kawasan khusus. Untuk untuk kawasan ini untuk khusus, kawasan khusus ini perlu menggunakan beberapa kawasan yang menggantikan dari kawasan lain. Baiklah, jika ia adalah kawasan akademik, kawasan ini seharusnya menggunakan banyak kawasan akademik. Jadi, kawasan yang lebih tinggi bermaksud, semua kawasan akademik atau sebagainya dalam kawasan ini seharusnya di sana. Jika anda mengambil kawasan akademik ini, ia tidak lebih lama akademik, ia menjadi generik. Bagaimana? Jadi, kawasan yang lebih tinggi bermaksud, yang lebih penting adalah kawasan untuk menggantikan kawasan khusus dari kawasan itu atau, ya, bagaimanapun, kawasan khusus yang berbeza dari kawasan yang particular atau kawasan kawasan yang anda analiskan. Tetapi, saya rasa anda tidak perlu beritahu ini. Saya tidak fikir kita menggunakan ini. Saya tidak menggunakan ini, tetapi ia baik untuk tahu keadaan keadaan keadaan keadaan keadaan dan keadaan keadaan keadaan ketika anda mempercayai, ia lebih penting jika anda mempercayai kawasan yang sama, tidak perlu kata yang sama, kawasan yang sama. Sekarang, saya adalah sedikit terbiasa kerana saya mempercayai berita berita dengan kawasan akademik. Jadi, tidak boleh menjadi begitu akurat. Jika saya mempercayai semua kawasan akademik, seperti semua kawasan yang telah ditubuh oleh pelajar saya, saya mempercayai semua kawasan dan kemudian saya mempercayai kawasan akademik dengan kawasan akademik. Kemudian saya dapat melihat kawasan yang berbeza. Jadi, saya boleh berkata bahawa kawasan akademik di Malaysia adalah menggunakan segera, bagi contohnya. Pada kawasan akademik di Amerika, tidak menggunakan segera atau mungkin tidak menggunakan segera. Kerana keadaan keadaan keadaan lebih tinggi dalam kawasan kawasan saya. Beritahu saya? Saya tidak tahu apakah saya beritahu. Saya akan menjelaskannya juga. Bagaimana dengan kawasan akademik yang berbeza dengan kawasan akademik yang berbeza? Bukan betul. Saya tidak ingin menggunakan kawasan akademik kerana ia lebih penting. Saya akan berkata, walaupun ia berbeza dengan kawasan akademik, maksud saya tidak bermakna kawasan akademik tidak boleh dipercayai dengan kawasan kawasan ia hanya bermakna jika anda melihat kawasan kawasan akademik, kawasan akademik ini sangat penting dalam artikel berlaku kerana anda mencari perkara itu, seperti anda menggabungkan semua tentang berbicara. Sudah tentu, kawasan akademik ini perlu lebih tinggi, tetapi ia tidak bermakna bagaimanapun saya tidak ingin menggunakan kawasan akademik, kerana jika anda katakan kawasan akademik, ia seperti anda berkata bahawa kawasan akademik ini bukan kawasan akademik, ia lebih seperti pentingnya, kawasan akademik yang ia mempunyai pada perkara lain. Okey, saya lihat. Terima kasih, Doktor. Terima kasih banyak-banyak. Okey. Ada lagi pertanyaan? Tidak? Ya, sangat senyum. Terima kasih. Okey. Saya tidak menggabungkan kawasan akademik terutama dalam kawasan akademik ini. Ia tidak datang dengan perkara kawasan akademik. Maksudnya, kawasan akademik dalam kawasan akademik anda ingin mencari perkara-perkara saja. Ia tidak mengajar anda untuk mencari kawasan akademik seperti itu. Anda perlu melakukan pilihan yang lebih baik. Jadi, untuk orang yang ingin melakukan itu, anda mungkin ingin menghubungkan kawasan akademik, kawasan akademik. Pergi ke kawasan akademik sekarang. Ya, kawasan akademik sekarang. Pergi ke kawasan akademik dan anda mungkin ingin mencari perkara-perkara ini. Jadi, saya tidak ada masa untuk mencari perkara-perkara ini. Mungkin untuk sesi selanjutnya. Tapi jika anda ingin menjelaskan perkara-perkara ini, ia disebut kawasan akademik dan ia adalah sebahagian dari kawasan akademik. Tetapi hanya untuk bahasa Inggeris pada saat itu, hanya untuk bahasa Inggeris pada saat itu, untuk Malay dan sebagainya, anda perlu beri mereka bahan-bahan. Seperti anda perlu mengambil bahan anda sendiri untuk mengambil bahan-bahan yang anda akan dapat menemukan untuk anda. Yang mereka ada adalah semua bahasa Inggeris, POS, sebahagian dari kawasan akademik. Ini untuk orang-orang yang ingin menjelaskan perkara-perkara, kawasan akademik sekarang, atau adik-adik dan sebagainya. Ini berkawasan akademik pada sebahagian dari kawasan akademik. Anda mungkin ingin mencari itu. Tetapi angkut sendiri tidak menghubungkan perkara-perkara yang penting. Angkut yang penting tidak menghubungkan perkara-perkara itu kerana anda perlu mencari sendiri. Baiklah, jika tidak ada pertanyaan lagi. Bagaimana dengan keadaan? Tidak? Mereka berada di sini. Mereka berada di sini. Saya tidak tahu. Ya. Doktor Dayang, bukan? Doktor Dayang. Doktor Dayang. Saya... Apa ini, Pn. Kiriman? Okey. Maaf, saya mahu tanya. Kalau kawasan akademik itu yang berbentuk kopi, maksudnya apa ini? Bagaimana nak tukar dalam bentuk TXT-nya? Itu yang lecih sikit. Tapi sekarang, apa yang anda boleh lakukan adalah anda menggunakan semua ini. Apa ini? Gunanya... Apa ini? Image-to-tax. Bagaimana? Ajar-ajar-ajar ini. Image-to-tax. Sekarang, rekanan TXT-nya dah makin jangka. Jadi... Tidaklah. Image-to-tax. Image-to-tax. Image... Biasanya, kita mencari. Tapi pada hari itu, bergantung pada kualiti pimpin atau kualiti kopi yang kita ada. Jadi, yang ini. Yang ini yang selalu menggunalah. Tapi saya rasa tak mengapa. Ia selalu menghubungi. Tapi... Yang ini perlu dipercaya. Boleh menggunakan ke-50 gambar. Jadi, jika anda menghubungi snap, bagi contoh, saya akan mencari yang lain. Saya akan mencari Google dan lihat. Saya akan mencari TXT-nya. Yang ini. Menurut anda, TXT-nya adalah... TXT-nya adalah image-nya. Tapi dalam PDF, anda hanya menggunakan Adobe 2? Adobe Acrobat. Anda hanya mengubahnya ke TXT. Dari... Dari... Dari Adobe Software. Tapi ini adalah image-nya. Jadi, mari kita lihat. Saya akan menolakkan... Saya akan mencari TXT-nya. Saya akan mencari TXT-nya. Tempat, tempat, txt-nya. Tak nampak ini. Okey. Ini tetapi kabo. Okey. Biar saya mencari tiga gambar dan lihat. Okey, mari kita lihat. Saya ada gambar ini. Problem dengan gambar adalah selalu kualiti gambar. Mari kita lihat gambar ini. Artikel, scan. Biar saya mencari tiga gambar. Tidak mengapa. Biar saya mencari tiga gambar. Oh, terlalu besar. Oh, terlalu besar. Biar saya mencari tiga gambar. Okey, saya mencari tiga gambar. Jadi, tiga gambar terlalu besar. Sebenarnya, tiga gambar adalah Google Lens. Nanti, saya akan mencari tiga gambar. Okey, ini tiga gambar. Baiklah. Kemudian... Tiga gambar. Tiga gambar. Yang ini cash Oh,ں kaya ini beli flarete malam. Okey. Terima kasih. Tengah gambarक little ni processor. Kamu boleh mempercayangi gambar sehing人 ataupun tiga gambar bagi file ini. Okey. Oh, kita boleh mencari gambar tiga gambar tsunami bagi penta tulang. ada banyak lagi lah yang yang yang ada ni macam online OCR pun ada so you search for the file let's say I upload this article tadi and then you can choose whether you want to use dog ataupun plain text and then you make sure your language is there yang ni yang sebenarnya mele tak ada ada ada mele ada mele ada dan convert you will take some time right let me see another one is google lens lah tapi google lens ni dia on your mobile tu tapi they legislate because you want to copy to susah ya ni dia dah copy okay so yang ni article yang newspaper article cutting tadi tu yang ni the one that i downloaded as an image just now sorry i just want to show so many this one this is image right image so you use the tool just now it converted it to text right but but you can see depending on quality of the image some of the words dia tak detect right some of the words too dia tak detect right so this is one but you can try others okay any other tu Dr. Dayan hello Dr. Nora okay Dr. Nora here very interesting talk to him iya pun belum mencoba ni but my students my student ada buat benda ni ya i don't know how he did it he managed to get like a one million wow i think the person yang apa yang yang dia ada program yang dia buat macam formula formula untuk dia clean up the the data or not so tadi dayang dayang cakap tadi kan macam macam and comedy dia ada english sahaja dalam tu kan english punya corpus kan yes tapi if you want to create your own corpus yang dari bahasa lain tu that you have to clean up the data it's quite complicated manually you know kan so i remember my students uh usman tu dia consult Dr. Hadimanlah Hadiman from English Science 30 malam dia pandai lelitikan tu dia memang bidang computational linguistics jadi dia untuk apa input kepada dayang tadi yang i remember i was there dia ajar usman tu macam mana nak clean up the data ya jadi usman had problem with the data because macam tadi kan ada macam program tu dia tak dapat read certain things right macam symbol symbol apa tu dot ke sign symbol apakah dia ada certain symbol dia tak boleh baca tu so if they're not so lagi dia tak buang data symbol symbol tu kita tak boleh guna untuk ancon ni betul ah so the the you can do it manually satu per satu symbol tu dibuang so my my student actually my student taught me how to do it but i haven't i haven't try it again dia boleh dibuat secara manual dayang tapi you can always pay people to do it for you and satu lagi dia boleh guna programming lah macam the formula dia maka guna untuk clean up the data and it doesn't take that much time yang saya tahu lah this is from my experience usman is doing models obligatory models in pakistani english yeah yeah so he had nobody wants to give him people don't want to give him the the english data kan corpus tu ini dia terpaksa buat sendiri dia he collected from the from different from in in text form in from the apa nama from the internet kan but he managed to do it from zero he managed to do it so dayang kalau you not you boleh consult dia lah usman nama dia usman tu boleh how he created his own corpus yeah yeah yeah there are a few what is there are a few corpus builder yang boleh kita guna ada corpus builder lah macam mana ada ada ada so corpus builder dia dia keringamlah the thing is um kita masih juga kena macam yang jadi kalau kalau dia kalau dia jenis macam ini printed macam masih tugas kita untuk scan you know untuk untuk extract tapi kalau you you get from soft copy yang macam all from web that will be easier lah because web version tu kita lagi link like this is one example yang i'll show you this link this is uh this link is called web page to plain text so you just give the link right and then you can convert to text but the problem is like i said it will also include all the menu atas ni so you can uh you can delete ni ni nanti so you just take this part only all right you can just take this part only but still it's similar to what similar to what we were doing just now lah masa mula mula tadi you still have to decide which part you're the take you just copy paste copy paste copy paste if you use corpus builder can download you can search corpus builder what happens is corpus builder below kita copy plain text ni to the corpus builder the corpus builder will arrange line by line systematically lah not not like they jump up everything but but for ncon actually ncon is quite quite intelligent enough even if like just just on your data ni if you just copy paste randomly like this it will still read walaupun you know even though the the sentences are all destointed like this it will still be able to read it just that we just have to remove all these extra things that we don't need right so like like notonora mentioned you can use some command to to remove but you need to know what you're removing lah like if you are looking for the star article the star article the other tendency to use like uh read like with related news and however you search for those thing and then it will be removed from your from your corpus but the easiest way the issue without using any software is actually the find a replace all right fine place fine let's say you find you find related news then replace it with blank just to come blank just put a space and then replace all for example lah and then it will search and then you will replace all these words that you don't want or let's say you don't want the word i just try here then just replace all then all the word we rush will be removed this is this is the simplest way like what we do in microsoft word or not that but there are software available like what was mentioned by dotonora cuma yang tu requires a bit of programming lah right it's a bit of programming if you those who are interested so so correct yang what we are talking about today is the analysis part like i mentioned earlier juga if you don't have the corpus you can't do the analysis so ancon is only meaningful after you have done your after you have done your compilation or your corpus too right so i think uh let me check let me check uh this lauren sentinine i think he has a do it i can't remember whether he provide the ancon builder not here maybe not here not here but i'll i'll share if you want to a corpus builder cuma corpus builder there is another software so it could be complicated but i think the easiest way is to just copy it in text format like this right like just copy it in text format or uh you can copy in microsoft word first or pdf whatever you want but save it as tst uh text then you can use ancon easier okay maybe another session on building corpus lah right yang ni yang ni just analysis the pasal be not not about building the corpus but if you want another session we can have another session la maybe can invite can always arrange that you know you invite dot adiman kali tapi dot adiman you're gonna python i know i know so because for for computational linguistics we also use it for you know sentiment analysis and everything that one is another software but more or less the same thing lah we still have to compile the the corpus anyway still without the corpus we can't do any analysis so uh like fire and the one that you can download is for social media same thing uh the the another software by lauren senteni is called fire and those who of you who are doing social media analysis you can try that software first uh the uh you can extract posting from facebook from twitter now it's under review because of the changes now kan the tukar x and then elemas remove all the api so so you can't use the twitter data directly you have to do the manual manual extraction but um those extra extra ni it's more technical lah that's why i don't really cover today it's more on the um technical part of how to how to build your corpus but ancon is more to analysis more to analyzing your your your text textual data so for for those who are doing mini research like if you if you are compiling uh compiling you know all this article using txt sort by article that will be more than enough actually for for for for analysis it's just that yeah lah repetitive work lah copy paste copy paste you know that kind of thing okay any other question okay i was back to the tenisa to an employee go around participant thank you so uh that actually makes me feel a little bit better about my inability to play people out to use and call um yeah i have to share the oh yeah you want to share the kutakut yeah i need to share the the attendance okay so i have an activity attendance ni manita sharing okay this is the attendance