 نحن الآن في الجزء الرابع، في من الديزيشن تري، اللي هو بحكيبنا عن الأورفيتين والبرولين أو الأورفيتين والأندر فيتين وعشان الجنب كيف يعمل برولين هلأ أيشي اللي يعني أورفيتين؟ أنا باجه بكسم الشجرة عندي، بدي أرجع كما نسليت دورة لما باجه بكسم الشجرة عندي، بتخيرين أنتو هون أنه إحنا اطلع معه في شجرة اللي هي كل هون، كل إشي بالنهاية كان سفر يعني ثلاثة سفر، ثلاثة سفر فكانت بيور، كل البرانجيز كانت بيور هلأ هاي على داقة صغيري بالسلايت، أكي تخيلوا لو عندي أنا مثلا، مثلاً ميتين مليون ريكور ولا أكثر حتى هاي كيف حيطلع حجم الشجرة، حيطلع حجم الشجرة كبير ولو سأنا أنه كم عدد النوت في آخر في الليف نوت، كم عدد عشان نعمل بيور بتعرفوا بالواقع حننوصل لنتيجي أنه قد يكون واحد أو ثنين أو خمسة بس من ميتين مليون فبيطلع كثير، بيطلع داقة، بيطلع الشجرة كبيري بيطلع النوت بيور بالنهاية، بالنهاية، بالآخرة بس عددها قليل، ليش؟ لأنه أنا عندي حلات كثيري جدا وبالتالي شجرة بطلع تكسر، تكسر، تكسر، تكسر هلأ هذا الإشي مش جيد حتى لو إحنا علمنا أنه القرفة على القرفة يجب أن يعمل لأنه النهاية بس الحقيقة الواقع، لا حلا طبعا، أنت بتعرفوا أنه ضمور ويسبليت ده هاير ده اكيوريس، اكيوريس يصير أحسن ولكن إشجرة بيصير أكبر بس مش مهم على فكرة بس إشجرة لتكسر دي موريس بيسيفيك ديزيشن تري التري تمعيتنا لما تكبر كثير لدرجة أنه أنا في عني خيّروا عندي 200 مليون ريكورد ولا أتفرح حتى عميك ربوز مليارات وروح ده السنها وتطلع الشجرة بالنهاية واحد والأثنين والعشرين تحت بيور وكتطلع برانجز تصير جدا بسعوعة عملت عليها بيور وبرانجز مزلت فيها ليفلز بيجوز بالمياد من الليفلز وبطلع احتواء حلوة اثنين والعشرين ليه؟ لما يقول هاي الشجرة بيطلع زي هيك هاي الشجرة بتقول سبسيفيك للداتة تبعتي سبسيفيك للداتة تبعتي بس مش جيدي للنكس داتها مش جيدي للنكس داتها معناتو أنا لما بيدي آجي أستعد تري لبتطلع عندي أستعملها تكلسفائي نيوتاتا ويكونش أداء جيدة طب ليش طبني أنا عملتها على الآخذ لأنها كانت مدربي على مدربي كثير على الداتة اللي قبل فهي سبسيفيك للداتة اللي قبل فطبعا الموارس سبسيفيك نعرف هاي نقاعدي سبسيفيك سبسيفيك will be too specific and accurate to the training data but becomes less accurate for review that thus the tree now will not be able to classify the data that they didn't see بكريمات أخرى the algorithm become too specific to the data we use in the training and cannot generalize I haven't thought that it is an overfitting أنو أنا دربت الموديل عندي على داتة صارت تاصار الدقة بجوز 100% أو قريب عليها للداتة وين للداتة اللي بإيديا بس أنا للداتة اللي تيجيني جديد بتبطل الموديل طبعي ببطل أنو يعني generalization طبعا بيكون كلير وبتالي بطل أداقه مليح طيب شو بمنا لو أنا نتخيل روض مرجع على الشجرة نتخيل أنو هاي الشجرة عندنا بدل ما يطلع لي ثمين وثلاثة وإلى أخرى خليها أوقف لعن لي في المعين وما يكون شبيوه ما تكون شبيوه طبعا لكي باتجتها مش مشكلة من كل هور مثلا مثلا عندنا ثمين يس وثلاثة ما ولله يو مد وبتالي أنا بعمله probability probability يعني مش شرطة الداتة النامبر of nodes في leave nodes مش شرطة يكون على الأخر وممكن أقول أعمل ووقف لما يوسر عند ميتين يعني يكون ووقف إنه بيور ووقف وانتي وانتي يجي تستعمل الداتة يستخدم بالنهاية يقول أعمل probability يعني حلا بالتالي هي يكون الداتة more more general طبعا بتقول لي أستاذ طبعا تنعمل more general كما ها تلقى بلاشة وكيف هور خلينا وكيف هور طبعا أو وصير كلك طبعا عندما هاي الداتة الشجر عندها بالتالي من جزد شاكين مشكلة بس عندما تاتت لما الشجرة تكون كتير كبير تكتوقف عند مثل الليبل الثالث الليبل الرابع وبعدين خلاص بتكيش الميتين الليبل اللي تحتو حلا مرات انتي وار مش وبرفتين تعمل اندر تعمل ايش اندر فا ما بدنا لا نعمل لا وبرفتين يعني وانت بعمل اندر فتين يعني بمعنى غرباء تفعن لبل صغير وذا بدر وعلى الآخر بعمل اوبرفتين هلا اوبرفتين او كيرز when trying to model the training that perfectly اوبرفتين means board generalization the test performance results tell us how well our model generalize فا اوضى الاشياء عشان مع الدرش اعرف ايه مقدرش ايه ايه اطلع في رتيجي او عشان مطلعش في رتيجي انو انا عندي لا وبرفتين ولا اندر فتين شو الحل الحل ان اعمل نسموها اعمل تجارب صغير على الشجرة بحيث ان او لازم اعمل بروني او الاشياء لازم اعمل اكوز من الشجرة اشياء عند اللي بالمعادي هذا اللي بالكي بدأت كرر بنعناش مثلا اتراي نتو برو دي دي تري That is large اللي دا عندي كان large three يعطوا افويد اوبرفت يعني كمليش بس ونتو stop انا ما بقدر اعرف على انو لي في اعمل stop كدهنا طريقا اعمل بري بروني او بوست بروني اشو يعني بري بروني يعني انا اصلا بالديجي الشجرة كبيري و بوست بروني اني بعد ما انديجي الشجرة بروه بكوز منها و بكودي بديش كده و كده و كده طيب بري بروني يعني شو يعني انا كي بدأة يعني و نقول كيف ده سويها يعني كيده يعني يعني يعني يعني تعني يعني يعني مع them والبوست بروونيك، بعدما نبدأ الشجرة، بدنا نعمل شوية validation عليها، ونشوف عنول الناس. وعلى فكرة، البوست بروونيك هو عادة اللي يستعمل. باختصار، ارجيكم في نوع الداتة تتكسم ثلاث اكسام، إحنا منكسم الداتة تبعثنا لك اسمين، إحنا نسمي تس داتة، والترينيك داتة، هذا إحنا. وإحنا نأخذ كرداش، إحنا نفتريد 100 مليون، نأخذ ثلاثان الداتة للترينيك، والثلاث للتستيك، بس التستيك عشاني كل النتيج يجي بيهاقي كيف طلع الموديل، يعني ممليخ ولا مش مليخ. سهلا، لبروونيك، لبروونيك اللي حكيت عنه هور، لبروونيك هاد، البوست بروونيك، كيف ننساوي؟ إمي أنا بروح على الشجرة، والدكس كس منها، بدأ كس كس منها. هو الموديل جوه نفسه يعني، ألغو ريفير، بروح بكسمت ترينيك داتة لنوعين، واحد من يسميه فالي دايشن، واحد يترينيك. طلعوا من طبكي، هاي إيكو تسيك، إبتعتوا هذه الميط، سوري مش ميط من اليوم، نرتي سببا بيو خمسين ألف، ثلاثين الداتة. من كله هاي، أو أقل، ستمين ستين ألف، من كله هذورة ترينيك، وهذورة ثلاث الداتة، طبش فيه، إتربع جانب، ما شي؟ يعني طبش فيه لاترينيك، طيب، هو بوخد الداتة تبعت، اللي هي ثلاثين، يخمب منها شوي على جانب، خبيهم، ما شي؟ سالي، خبيهم، خبيهم على جانب، نفترض خب 160، ضل عندو خمسين ميط ألف، بوخد هل خمسين ميط ألف؟ بلبلمين ميط هم يشجرها كذه، ليها؟ بعد ما ييب الشجرة بروح على كل نوت في الشجرة، يبلش من تحدي، بروح على كل نوت في الشجرة، بكون لوحدها في تحاي، كيف الدكة بصير على 16 ميط، اللي همي ال因为، كيف الدكة بصير؟ أو متأثرة جدقة يعني نفس جدقة تقريبا أو ممتاز معنى كالشجرة هاي نود ايش ساوي فيها قص رو على نود ثاني احذفها ورد ارجع قايم على 160 لعندك على بلديش انداته كيف ذات صار الداته اخسرت بس اخسرت واحد بالعشره اوه مش مهمات قص نود ضلك جرب على كل النود ضلك جرب على كل النود كل ايش يتأثر كثير يعني نود لما حضرت صارت الاكيوريسي تعتل الشجرة مش مليحة لا معناتو هذا خليه هاي نود خليها تقص فعشه هلا بيطلع النتيجي انه راح كسكسل النود كسكسل اشياء اللي مش مهمي طلع شاشة انها كده صغيري والاشياء اللي مش مهمي معلها مكسوسة على فكرة كمان اذا بدنا عشان نتأكيد بروح بروح بخربش الداته خربش الداته 150 يعني بروح هادولة 600 فلفات هادول ورد خربش الداته ورد يكسنها ورد يجرب على فلفات وثلاث وشوف اذا بكسكسل اشياء ثاني اوه برجعوا بخلص هيك مكون الداته الشجرة مكسكسا مكلمي برون ووتكون الشجرة يعني محطوطكيها بس الضرورة وحنا ليش مستخدمت تيستين داته لانو احنا بيحاج ينشوف المدل طبعنا كدهش جاء في النهاية كدهش المدل طبعنا جاء فهذا هو الحك اللي انا قلتوا use validation test to get the errors estimates اشعار نشوف يحسب الايرور انو لما مكس موت كدهش الايرور صار for each node N in the tree pretend that all of its descendants nodes are broon خير انو منكسون then calculate the error وبعدين broon the tree at the node that yields the highest error reduction ورئي اظلك اذا الحك اللي قلتوا اظلك تقيد في عبان ما اي تطلع الشجرة اقل ما في اسئلي في اسئلي في اسئلي فهمنا اذا شو هو الاندر فتنك و الابر فتنك كل الاندر الابر فتنك اذا اعملت الشجرة بالكامل تطلع الشجرة مليحة او اطلع الشجرة اداء هجية بالنسبة للدات اللي عملنا عمل عليها training بس مش شر تكون مليحة للدات القادم و اذا صخرت شجرتي بس يراندي برنو العكس يصير تو جنرا فانا بين الاندر فتنك و الابر فتنك لازم اعرف وين اوقف و عشان اعرف وين اوقف افضل طريقة انا نعمل بوست بروني و زي ما حكيناها من كسم الداتة او هو البرنامج بكسم الداتة على validation ولا testing ولا training validation and training و بس يستعمل validation عشان يعمل بروني اذا في اي سؤال