Mashinani o'rganish: mohiyati, tamoyillari, vazifalari
Mashinani o'rganishning mohiyati
Mashinani o'rganish - bu statistik modellar va mantiqiy operatsiyalarga asoslangan kompyuter tizimlarini o'qitish usuli. Algoritmlarni avtomatik ravishda takomillashtirishning bu usuli aniq ko'rsatmalarning yo'qligini nazarda tutadi. Oddiy qilib aytganda, kompyuter tizimiga kiritilgan ma'lumotlardan foydalangan holda "2+2 qilish" formatida emas, balki "xuddi shunday qilish" vazifasi beriladi. Mashina odam kabi fikrlashni o'rgatadi, faqat bir necha marta tezroq. Mashinani o'rganish usullari doimo rivojlanib bormoqda. Bugungi kunda kompyuter tizimlari katta hajmdagi ma'lumotlarni chuqur qayta ishlashni namoyish etadi. Uzoq vaqt davomida kompyuterlar insonga o'xshash muammolarni hal qilish uchun ishlatilgan. Nisbatan yaqinda ma'lum bo'ldiki, mashinalarning asosiy afzalligi katta hajmdagi ma'lumotlarni qayta ishlash va mantiqiy operatsiyalarni bajarish tezligidir. Kompyuter tizimi bir zumda bajara oladigan ko'plab vazifalarni hal qilish insonning kuchidan tashqarida.
Agar kerakli hajmda to'g'ri kiritilgan ma'lumotlarni taqdim qilsangiz, mashina tez va aniq natija beradi. Bu sun'iy intellekt va mashinani o'rganishning paydo bo'lishiga olib keldi, ular hozirda faol rivojlanmoqda va takomillashtirilmoqda. Mashinani o'rganish asosini qayta ishlangan va tuzilgan ma'lumotlar to'plami tashkil etadi. Bu ma'lumotlar to'plami. Ular shaxs yoki kompyuter tizimi tomonidan muayyan operatsiyalarni hal qilish misollarini ifodalaydi. Ma'lumotlar to'plamiga asoslanib, ishlab chiquvchilar kompyuter tizimlarini ma'lumotlar bloklari bilan ishlashga o'rgatishadi: tasniflash, bashorat qilish, standart muammolarni hal qilish uchun yangi algoritmlarni ishlab chiqish, gipotezalarni tuzish va h.k. Ma'lumotlar to'plami har kuni o'sib bormoqda va sun'iy intellekt usullari yaxshilanmoqda.
Mashinani o'rganish texnologiyalarini rivojlantirishga misol - Yandex Music. Xizmat foydalanuvchining musiqiy afzalliklarini tahlil qilishi, o‘xshashlarini topishi va pleylistga ularning didiga mos qo‘shiqlarni qo‘shishi mumkin. Ushbu innovatsion texnologiya Netflix kompaniyasining ishi. Bu butun dunyo bo'ylab raqamli kontentni iste'mol qilish mantiqini tubdan o'zgartirdi. Hozirgi kunda tavsiya qiluvchi tizimlar turli sohalarda faol foydalanilmoqda. Hech bir inson bunday vazifalarni mashina kabi tez bajara olmaydi. Yandex.Music xizmati millionlab foydalanuvchilarga ega va ularning har biriga barcha musiqiy janrlarda va mijozning didiga mos keladigan kontent xilma-xilligida malakali mutaxassisni tayinlash haqiqatga to'g'ri kelmaydi. Yandex.Music uchun bu oddiy vazifadir, chunki mashinani o'rganish.
Mashinani o'rganish tamoyillari
Dasturchi kompyuter tizimiga barcha mumkin bo'lgan kombinatsiyalar va echimlarni hisobga oladigan aniq ko'rsatmalar bermaydi. Mashina kirish ma'lumotlari asosida mustaqil ravishda qidirish va tahlil qilish uchun dasturlashtirilgan. U bir qator belgilarga asoslangan naqshlarni topadi, ob'ektlarni tasniflaydi va bashorat qiladi.
Mashinani o'rganish ma'lumotlar to'plamini yuklashdan boshlanadi. Bu so'rovlarni qayta ishlash uchun kiritilgan ma'lumotlar. Misol uchun, mushuk va itlarning teglar bilan suratlari. Mashinani o'rganishdan so'ng, kompyuter tizimi yorliqlar joylashtirilmaydigan yangi ma'lumotlar bazasida hayvonlarni mustaqil ravishda tan oladi. Tizim bashorat qilgandan keyin o'rganish tugamaydi. Qanchalik ko'p ma'lumotlar tahlil qilinsa, natijalar shunchalik aniq bo'ladi. Mashinani o'rganish texnologiyalaridan foydalanish kompyuterlarga nafaqat tasvirlardagi yuzlarni, balki har qanday ob'ektlarni, narsalarni va boshqalarni ham tanib olish imkonini beradi. Ular matn muharrirlarida grammatika va imloni tekshirishda ham samarali qo'llaniladi. Bu avtomatik tizimlar bo'lib, ular nafaqat imloni tekshiribgina qolmay, balki kontekst, semantik ma'no va lingvistik nozikliklarni ham tushuna oladi. Turli mavzularda (yangiliklar, iqtisod, sport va boshqalar) mustaqil ravishda maqolalar yozadigan maxsus dasturlar allaqachon mavjud.
Mashinani o'rganish tarixi
Dastlab, kompyuterlar inson miyasiga kirishi mumkin bo'lgan muammolarni hal qildi. So'nggi yillarda mashinalar operatsiyalarni bajarish uchun yangi algoritmlarni topishga qodir ekanligi haqida tushuncha kuchaymoqda. Sun'iy intellekt faol rivojlanmoqda va mashinani o'rganish texnologiyalari bilan bir qatorda ko'plab sohalarda qo'llaniladi. Mashinani o'rganish usulini qo'llash tarixi 1950 yilda shashka o'ynash uchun dasturlarni ishlab chiqish bilan boshlangan. O'sha paytda qo'llanilgan umumiy algoritm bugungi kunda ham dolzarbdir. Hisoblash quvvatining o'sishi mashinani o'rganishga qo'yilgan vazifalarning murakkabligiga olib keldi.
Mashinani o'rganishni rivojlantirishning asosiy bosqichlari:
- 1946 yilda o'sha davr uchun innovatsion ishlanma taqdim etildi: AQSh armiyasining o'ta maxfiy loyihasi bo'lgan ENIACning bir qismi sifatida birinchi umumiy maqsadli elektron raqamli kompyuter. Amerika harbiylari dushman nishonlarini aniq otishlariga yordam berish uchun elektron jadvallar yaratdilar. Ammo, bunga qo'shimcha ravishda, kompyuter keng ko'lamli muammolarni hal qilish uchun dasturlashtirilgan.
- 1950 yilda ingliz olimi Alan Turing kompyuterning inson kabi fikrlash qobiliyatini aniqlash uchun mo'ljallangan empirik testni ishlab chiqdi.
- 1958 yilda psixologiya, neyrofiziologiya va sun'iy intellekt sohasidagi amerikalik olim Frenk Rozenblat Perceptron - miyaning axborotni qabul qilish kompyuter modelini ishlab chiqdi. Bu birinchi neyron tarmoq modellaridan biri edi. Uning asosida Mark-1 neyrokompyuteri yaratilgan.
- 1959 yilda amerikalik sun'iy intellekt bo'yicha olim Marvin Minski murakkab muammolarni hal qilish uchun birinchi sun'iy neyron tarmog'i SNARCni yaratdi.
- 1959 yilda amerikalik tadqiqotchi Artur Samuel birinchi o'zini o'zi o'rganadigan kompyuter shashka o'yinini yaratdi. Aynan u "mashinani o'rganish" atamasini kiritgan. Muallifning fikricha, bu kompyuter dastlab dasturlashtirilmagan xatti-harakatlarni namoyish eta oladigan jarayondir.
- 1967 yilda ma'lumotlarni tasniflash uchun ishlatiladigan birinchi metrik algoritm ishlab chiqilgan. Sun'iy intellekt tanib olish va o'rganish uchun naqshlardan foydalanishni boshladi.
- 1997 yilda Deep Blue superkompyuteri birinchi marta shaxmat bo'yicha jahon chempioni Garri Kasparovga qarshi oltita o'yinda g'alaba qozondi.
- 2006 yilda ingliz olimi Jeffri Xinton "chuqur o'rganish" atamasini kiritdi. Sun'iy neyron tarmoqlar katta hajmdagi ma'lumotlarga o'rgatiladi. Ushbu yo'nalish hozirda faol rivojlanmoqda va eng ilg'or yo'nalishlardan biri hisoblanadi.
- 2011 yilda Google Brain asos solingan - neyron tarmoqlar bilan ishlash loyihasi.
- 2012-yilda Google X Lab bo‘limi tasvir va videolarda mushuklarni tanib olish uchun neyron tarmoq algoritmini yaratdi. Xuddi shu yili mashinani o'rganish va tahlil qilish uchun mo'ljallangan Google Prediction API bulut xizmatiga asos solingan.
- 2014-yilda Mark Sukerberg kompaniyasi surat va videolardagi yuzlarni 97 foizgacha aniqlik bilan taniy oladigan DeepFace neyron tarmog‘ini ishlab chiqdi.
- 2015 yilda Amazon Amazon Machine Learning dasturini chiqardi. Bu mashinani o'rganish platformasi. O'sha yili Microsoft analogni ishlab chiqdi: Distributed Learning Machine Toolkit.
Mashina o'rganish qayerda qo'llaniladi
Mashinani o'rganish sun'iy intellekt sohalaridan biridir. Ushbu ilg'or texnologiya eng samarali echimlarni ishlab chiqish, turli murakkab vazifalarni bashorat qilish va bajarish uchun mashinalarga kirish ma'lumotlaridan foydalanishni o'rgatadigan algoritmlarga asoslangan.
Mashinani o'rganish modellari keng funktsional imkoniyatlarga ega:
Tasvirni aniqlash va tasniflash . Mashinani o'rganish nafaqat berilgan ob'ektlarni, balki tasvirlar, belgilar va boshqalarni ham aniqlashga qodir. Neyron tarmoqlar ma'lumotlarni tasvirlar bazasi bilan solishtiradi va mos keladiganlarni qidiradi. Bu tibbiy maqsadlarda diagnostika uchun, masalan, rentgen tasvirlari asosida onkologik kasalliklar uchun faol foydalaniladi.
Matn tahlili . Bu tizimlashtirilmagan matn ma'lumotlaridan ma'lumot olish uchun ishlatiladigan mashinani o'rganish usuli. Misol uchun, ijtimoiy tarmoqlarda brend mahsuloti yoki xizmatlari haqida mijozlarning sharhlarini tahlil qilish.
Vaqt seriyalarini prognoz qilish . Mashinani o'rganish ishlab chiqarish quvvatini, inventarizatsiya darajasini, birja narxlarini va boshqalarni optimallashtirish uchun faol foydalaniladi.
Firibgarlikni aniqlash va kiberxavfsizlik . Masalan, noqonuniy bank operatsiyalarini aniqlash.
Tavsiya tizimlari . Bu foydalanuvchiga turli mahsulotlar, teleseriallar, kitoblar va hokazolar orasida harakat qilish uchun aqlli yordamdir. Tavsiya qiluvchi tizimlar shaxsiy imtiyozlar va tez-tez ko'riladigan kontentga asoslanadi.
Nutqni qayta ishlash tizimlari . Ular, masalan, turli tillarga avtomatik tarjima qilish uchun ishlatiladi.
Haydovchisiz avtomobillarni ishlab chiqish . Bu elektr transport vositalarini haydovchisiz xavfsiz harakatlanish imkonini beruvchi avtomatik boshqaruv tizimlari. Tizim turli to'siqlarni (svetoforlar, piyodalar, bordyurlar), shuningdek, optimal marshrut va tezlikni aniqlaydi.
Audio ma'lumotlarni tahlil qilish . Mashinani o'rganish kompyuterning inson nutqining ma'nosini tushunishi uchun sharoit yaratishga imkon beradi.
Barcha biznes jarayonlarini optimallashtirish . Sanoat, ishlab chiqarish va savdoning turli sohalarida mashinani o'rganish faoliyatning ko'plab asosiy jihatlarini boshqarish imkonini beradi. Bu ishlab chiqarilgan mahsulotlar sifatini nazorat qilish, muntazam jarayonlarni avtomatlashtirish, inson resurslarini qisman yoki to'liq almashtirish, ishlamay qolish vaqtini, baxtsiz hodisalarni minimallashtirish va boshqalar.
Tibbiy ma'lumotlarni qayta ishlash . Mashinani o'rganish tibbiy ma'lumotlarni tahlil qilish va o'ziga xos xususiyatlarni aniqlash orqali saraton yoki diabetga tashxis qo'yish imkonini beradi.
Mashinani o'rganish qanday muammolarni hal qiladi?
Sun'iy intellekt sohasidagi zamonaviy tadqiqotlar ma'lumotlardan eng samarali foydalanish va chuqur o'rganish tizimlarini rivojlantirishga qaratilgan. Bugungi kunda kompyuter tizimlari yuqori unumdorlikka ega.
Mashinani o'rganish tufayli sun'iy intellekt keng ko'lamli vazifalarni samarali hal qiladi: ma'lumotlarni tahlil qilish, prognozlash, mavjudlaridan eng yaxshisini tanlash, g'ayritabiiy operatsiyalarni qidirish, oqilona qarorlar qabul qilish va boshqalar.
Mashinalarni o'rganish tizimlari ko'p sonli hisoblash operatsiyalari amalga oshiriladigan sohalarda talabga ega. Bu bank skoringi (shaxsning kreditga layoqatliligini baholash tizimi), marketing, statistika va demografiya bo'yicha tahlillar, biznesni tahlil qilish va rejalashtirish, investitsiya strategiyalarini tanlash, soxta yangiliklar va firibgarlik operatsiyalarini aniqlash.
Keling, yirik ishlab chiqaruvchilar tomonidan qanday mashina o'rganish qo'llanilishiga misollarni ko'rib chiqaylik.
- Xalqaro chakana sotuvchi Leroy Merlin omborlardagi inventar qoldiqlarini aniqlash uchun Big Data va Machine Learningdan foydalanadi.
- Tavsiya qiluvchi tizimlar xizmatlar va ilovalarni sozlash uchun elektron tijorat va marketingda keng qo'llaniladi.
- Spotify striming xizmati shaxsiy imtiyozlar asosida moslashtirilgan musiqa kurslarini taqdim etish uchun mashina o'rganishdan foydalanadi.
- Xitoylik robot changyutgich ishlab chiqaruvchi Ecovacs Robotics mashinani o‘rganish texnologiyalaridan foydalangan holda aqlli tozalash funksiyasini ishlab chiqdi. Changyutgich simlar kabi begona narsalarni taniydi.
- Avtomatik tabassumni aniqlash va ovozli buyruq funksiyasi TensorFlow Light tizimidan foydalangan holda Raspberry Pi 3B+ mikrokompyuteriga asoslangan kamerada amalga oshiriladi.
- Undan investitsiya qilishda foydalanish bozor tahlilini o'tkazish, dolzarb yangiliklarni kuzatish, ayni paytda eng foydali aktivlarni tanlash va risklarni baholash imkonini beradi. Mashinani o'rganish, shuningdek, aktsiyalarning bozor qiymatidagi o'zgarishlarni taxmin qilish imkonini beradi va muhim yangiliklardan keyin ma'lumotlarni moslashtiradi.
- BarclayHedge tadqiqot o'tkazdi, bu to'siq fondlarining yarmidan ko'pi investitsiya qarorlarini qabul qilish uchun sun'iy intellekt va mashinani o'rganishdan foydalanishini va uchdan ikki qismi undan savdo g'oyalarini ishlab chiqish va xatarlarni kamaytirish bilan birga daromadni oshirish uchun foydalanishini ko'rsatdi.
- Mashinani o'rganish texnologiyalari tufayli hatto ilmiy kashfiyotlar ham amalga oshiriladi. Masalan, Google’ning DeepMind’ning AlphaFold neyron tarmog‘i 2020-yilda oqsillarni katlama mexanizmini shifrladi. Aytgancha, biologlar bu muammoni 50 yildan ko'proq vaqt davomida hal qila olmadilar.
Mashinani o'rganishning afzalliklari va kamchiliklari
Keling, mashinani o'rganish modellarining ijobiy va salbiy tomonlarini ko'rib chiqaylik.
Asosiy afzalliklari:
- Bir qarashda aniq bo'lmagan naqshlarni, tendentsiyalarni aniqlash va eng ehtimoliy prognozlarni qilish qobiliyati.
- Inson aralashuvisiz ma'lum funktsiyalarni amalga oshirish. Masalan, kiberxavfsizlik maqsadlarida mashinani o'rganishdan foydalanish tizimlarni xakerlik, ma'lumotlar sizib chiqishi va zararli dasturlardan himoya qilish imkonini beradi. Bu mutaxassisning ishtirokini talab qilmaydi.
- Mavjud ma'lumotlar miqdori oshgani sayin natijalar aniqroq bo'ladi.
- Dinamik tizimlarda katta hajmdagi turli xil ma'lumotlarni qayta ishlash qobiliyati.
Kamchiliklari:
- Amalga oshirishning yuqori narxi, shuningdek, mashinani o'rganish uchun etarli ma'lumotlar yo'qligida amalga oshirish.
- Uni o'rnatish uchun qimmat uskunalar va mutaxassislar talab qilinadi.
- Mutaxassis yordamisiz olingan natijalarni sharhlashda qiyinchilik.
Mashinani o'rganishning asosiy turlari
Mavjud mashinani o'rganish algoritmlari ikkita asosiy turga bo'linadi: o'qituvchi bilan o'rganish (nazorat ostida o'rganish) va bittasiz (nazoratsiz o'rganish). O'qitishning ikkala turida ham kompyuter tizimi tahlil va naqshni aniqlash uchun kirish ma'lumotlari bilan ta'minlangan.mMashinani o'rganish terminologiyasiga ko'ra, o'qituvchi mashinaning ishlashini nazorat qiladigan dasturchi bo'lishi shart emas. Bu ma'lumotlarni qayta ishlashga insonning har qanday aralashuvi.
Nazorat ostidagi mashinalarni o'rganish. Bu tur ko'p sonli ko'rgazmali misollar asosida modellarni qurish algoritmlari va usullarini birlashtiradi. Ular nafaqat kirish ma'lumotlarini, balki chiqish ma'lumotlarini ham o'z ichiga oladi. Agar mustaqil o'zgaruvchilar va model treningdan so'ng chiqaradigan maqsadli qiymat mavjud bo'lsa, algoritm nazorat ostida mashinani o'rganish hisoblanadi. Masalan, tizim qo'lda yozilgan yoki jingalak raqamlarni taniy oladi va ularni ma'lum bir raqam bilan bog'laydi. Oddiy qilib aytganda, nazorat ostida o'rganish bir qator farazlarni tasdiqlash yoki rad etishga qaratilgan. Mashinani o'rganish modelini o'rgatish uchun belgilangan ma'lumotlarning to'liq to'plami mavjud deb taxmin qilinadi.
Ushbu turdagi afzalliklar orasida strukturaning soddaligi mavjud. Nazorat ostidagi mashinani o'rganish katta hajmdagi ishonchli ma'lumotlar bilan bog'liq muammolar uchun idealdir. U asosan tasniflash va regressiya uchun ishlatiladi. Mashinani o'rganishda ma'lumotlarni etiketlash - bu ma'lum chiqish qiymatlari bilan kirish ma'lumotlarini aniqlash jarayoni. Belgilangan ma'lumotlar nazorat ostida o'rganish uchun zarurdir. Yorliqlash misoli: Mushuklar va itlarning millionlab tasvirlari "mushuk" va "it" so'zlari bilan yorliqlangan. Mashinani o'rganish bo'yicha turli ilovalar ushbu ma'lumotlar to'plamidan hayvon nomini rasmdan taxmin qilish uchun foydalanishi mumkin. Katta hajmdagi ma'lumotlarni yorliqlash juda mehnat talab qiladigan jarayon ekanligini tushunish muhimdir. Mavjud mashinani o'rganish ilovalari ushbu o'quv ma'lumotlaridan o'z tasvirlaridan istalgan ob'ektni taxmin qilish uchun foydalanishi mumkin. Biroq, millionlab yangi ma'lumotlarni etiketlash bitta mutaxassis uchun ko'p mehnat talab qiladigan va murakkab jarayondir. Amazon Mechanical Turk kabi hamkorlikdagi ish xizmatlari mavjud. Ular har qanday mehnat talab qiladigan jarayonni mikrovazifalarga ajratish va ularning bajarilishini ijrochilarga onlayn tarzda tarqatish imkonini beradi. Bu mashinani o'rganishni tezlashtirish va ma'lumotlarni etiketlashni tezlashtirishga yordam beradi.
Nazoratsiz mashinani o'rganish. Ushbu turdagi o'rganish algoritmlari etiketlanmagan ma'lumotlardan foydalanadi. Neyron tarmoq mustaqil ravishda ma'lumotlardagi korrelyatsiyalarni topadi, foydali xususiyatlarni ajratib oladi va ularni tahlil qiladi. Masalan, nazoratsiz mashina oʻrganish turli saytlardan oʻxshash maqolalarni tanlab, ularni toifalarga guruhlashi mumkin: fan, sport, investitsiyalar va hokazo. Tabiiy tilni qayta ishlash texnologiyasi maʼno va hissiyotlarni izohlash va tushunish uchun ishlatiladi. Savdoda nazoratsiz mashinani o'rganish sizga xaridlarda umumiy xususiyatlarni topish va ushbu ma'lumotlarni tahlil qilish imkonini beradi. Natijada, xaridor sariyog' sotib olsa, non sotib olish ehtimoli ko'proq bo'lishi mumkin. Ushbu o'rganish algoritmi o'xshash ma'lumotlar seriyasini tanlash va ularni guruhlash, anomaliyalar va assotsiatsiyalarni aniqlash uchun samarali. Nazoratsiz mashinani o'rganishni sozlash juda oddiy. Ushbu algoritm modelni ishlab chiqish uchun kirish ma'lumotlarini avtomatik ravishda tozalash uchun ham qo'llaniladi. Mashinani o'rganishning ushbu turining kamchiliklari orasida aniq bashorat qilish va chiqish ma'lumotlarining muayyan turlarini aniqlay olmaydi.
O'qituvchining qisman ishtirokida neyron tarmoqni o'rgatish. Bu oltin o'rtacha. Trening maʼlumotlar toʻplamida yorliqli va yorliqsiz maʼlumotlar mavjud. Dastlab, yorliqli ma'lumotlarning kichik miqdori mashinani o'rganish uchun ishlatiladi. Keyin algoritm avtomatik ravishda etiketlanmagan ma'lumotlar to'plamlariga teglarni joylashtiradi. Bu pseudo-marking deb ataladi. Yakuniy bosqichda model hech qanday aniq dasturlashsiz belgilangan ma'lumotlar to'plamida qayta o'qitiladi. Ushbu turdagi mashinani o'rganishning afzalligi shundaki, u katta hajmdagi etiketli ma'lumotlarni talab qilmaydi. Bu uzoq hujjatlar, tibbiy tasvirlar va boshqalar uchun juda qulay.
O'rganishni mustahkamlash. Ushbu algoritm qadamlar bilan bog'liq bo'lgan ma'lum mukofot qiymatlarini o'z ichiga oladi. Mustahkamlashni o'rganish video o'yin kabi ishlaydi. Ushbu mashinani o'rganish modeli maksimal mukofot ballarini olishga qaratilgan. O'yinlarda mustahkamlashni qo'llash natijalari qo'lda yasalgan hamkasblaridan ancha ustundir. Biznes kontekstida mustahkamlashni o'rganish noaniq ma'lumotlar muhiti bilan ishlashga qaratilganligi sababli cheklangan samaradorlikni ko'rsatdi. Mukofotlarni dasturlashda ishlab chiquvchilarning tarafkashlik elementi ham mavjud.
Mashinani o'rganish bo'yicha vazifalar turlari
Mashinani o'rganishning quyidagi asosiy vazifalari odatda aniqlanadi: tasniflash, regressiya, klasterlash va tabiiy tilni qayta ishlash.
Tasniflash. Sun'iy intellekt va mashinani o'rganishda bu ob'ektlar to'plamini ma'lum bir xususiyatga qarab sinflarga bo'lishdir. O'quv majmuasi uchun sinf yorliqlari ko'rsatilgan. Masalan, elektron pochta spam yoki yo'qligini aniqlash uchun tasniflash qo'llaniladi. Mashinani o'rganish yorliqli elektron pochta xabarlari misoliga asoslangan. Tasniflash bir qator xususiyatlar asosida kategorik javob beradi.
Regressiya. Mashinani o'rganishning bu turi tasodifiy o'zgaruvchining bir yoki bir nechta boshqa tasodifiy o'zgaruvchilarga bog'liqligiga asoslanadi. Regressiya turli xil biznes muammolarini hal qilish uchun faol qo'llaniladi. Bu, birinchi navbatda, prognozlash. Misol uchun, siz ko'chmas mulk qiymatini uning asosiy xususiyatlari (xonalar soni, qavat, ta'mirlash, infratuzilma va boshqalar) asosida aniqlashingiz mumkin. Model sotilgan ob'ektlar to'g'risidagi ma'lumotlarni o'z ichiga olgan ma'lumotlarga o'rgatiladi va narxni bashorat qiladi.
Klasterlash. Klasterlash - ob'ektlarni ma'lum belgilar asosida bir-birining ustiga tushmaydigan guruhlarga birlashtirish. Klasterlashdan foydalanishga misol sifatida ma'lum mahsulotlarni sotib oladigan maqsadli auditoriyani aniqlash mumkin. Model xarid ma'lumotlari yordamida o'qitiladi. U o'ziga o'xshash ehtiyojga ega bo'lgan xaridorlarni guruhlashi mumkin.
Tabiiy tilni qayta ishlash. Ushbu turdagi mashinani o'rganish vazifasi matn tahlili orqali muhim ma'lumotlarni chiqaradi. U, masalan, mahsulot yoki xizmatni ko'rib chiqish ijobiy yoki salbiy ekanligini aniqlash uchun faol foydalaniladi. Model sharhlar asosida o'qitiladi va ularning tonalligini aniqlay oladi.
Mashinani o'rganish algoritmlari
Mashinani o'rganishning asosiy algoritmlari bir qator amaliy muammolarni hal qilishda keng qo'llaniladi. Ularni bilish ma'lumotlar tahlili va sun'iy intellekt dasturlarini ishlab chiqish bilan shug'ullanadigan har qanday mutaxassis uchun zarurdir. Mutaxassis, ularning o'ziga xos xususiyatlarini tushungan holda, berilgan muammoni hal qilish uchun eng mos algoritmni tanlash imkoniyatiga ega bo'ladi.
Chiziqli regressiya. Bu mashinani o'rganishning asosiy algoritmidir. Chiziqli regressiya - bu bir o'zgaruvchining boshqasiga yoki bir nechta boshqasiga chiziqli bog'liqligi modeli. Bu turli sohalarda bashoratli tahlil qilish uchun ishlatiladigan oson talqin qilinadigan matematik formuladir.
Logistik regressiya. Ushbu algoritm ma'lumotlarni tahlil qilish va ikkita ma'lumot omili o'rtasidagi munosabatlarni topish uchun ishlatiladi. Ikkilik logistik regressiya odatda tasniflash muammolarini hal qilish uchun qabul qilinadi. Ularning ikkita mumkin bo'lgan natijasi bor.
Regressiya daraxti. Ushbu algoritm tasniflash va raqamli bashorat qilish uchun ishlatiladi. Qaror daraxtlarining qurilishi to'plamni kichik to'plamlarga bo'lishdan iborat. Bo'linish shoxlarning uchlaridagi barcha tugunlar barglarga aylanmaguncha davom etadi.
Tasodifiy o'rmon. Ushbu algoritm tasniflash, klasterlash, raqamli bashorat qilish, anomaliyalarni aniqlash va boshqalar kabi mashinalarni o'rganish muammolarini hal qilish uchun ishlatiladi. Tasodifiy o'rmon ko'p sonli qaror daraxtlaridan iborat. Xususiyatlarning tasodifiyligi har bir alohida daraxtni qurishda qo'llaniladi. Bu o'zaro bog'liq bo'lmagan o'rmon hosil qiladi. Qo'mitaning prognozi har bir daraxtning prognozidan ko'ra aniqroqdir.
Vektor mashinasini qo'llab-quvvatlash (SVM). Ushbu algoritm tasniflash va raqamli bashorat qilish masalalarini hal qilish uchun ishlatiladi. SVMda namunaviy ob'ektlarni eng maqbul tarzda ajratib turadigan giperplan quriladi. Ushbu algoritm anomaliyalarni topish muammosini hal qilishda ham samaralidir.
K- degani. Bu eng mashhur ma'lumotlarni klasterlash algoritmidir. Ma'lumotlar tasodifiy ravishda klasterlarga bo'linadi, ular xususiyat maydonida bir-biriga yaqin joylashgan ob'ektlar guruhlari.
Neyron tarmoqlar. Ushbu mashinani o'rganish algoritmi ko'plab turli xil muammolarni, jumladan tasniflash, regressiya va boshqalarni hal qiladi. Neyron tarmoqlar inson miyasiga taqlid qiluvchi modeldir. Ular har bir neyron umumiy xususiyatlarni topadigan katta ma'lumotlar to'plamlarida o'qitiladi.
Gradientni kuchaytirish. Bu tasniflash va raqamli bashorat qilish muammolarini hal qiladigan ilg'or mashinani o'rganish algoritmidir. U o'z prognozlarini zaif modellar (qaror daraxtlari) ansambliga asoslaydi, ulardan bitta samaralisini yig'adi.
Uyushma qoidalari. Ushbu algoritm ma'lumotlar bazalarida tegishli hodisalar va qiziqarli omillar o'rtasidagi naqshlarni topishga imkon beradi. U o'zgaruvchilar orasidagi nafaqat ochiq, balki yashirin naqshlarni ham aniqlay oladi. Mashinani o'rganish algoritmlari ro'yxati davom etmoqda: Naive Bayes, yadroli SVM, k-eng yaqin qo'shnilar (k-NN) va boshqalar. Ularning har biri o'ziga xos xususiyatlarga va qo'llash sohasiga ega.
Haqiqiy hayotda mashinani o'rganish ilovalariga misollar
Tibbiyotda qo'llanilishi. Mashinani o'rganish nuqtai nazaridan bemorlar ob'ektlardir. Kasallik belgilari, testlar, kasallik tarixi, davolash protokoli - bu belgilar. Ularni toifalarga bo'lish mumkin. Ikkilik xarakteristikalar: jinsi, ma'lum bir alomatning mavjudligi yoki yo'qligi. Ordinal xususiyat: kasallikning og'irligi. Miqdoriy xarakteristikalar: yosh, vazn, asosiy sog'liq ko'rsatkichlari (qon bosimi, puls va boshqalar). Barcha sanab o'tilgan va boshqa kerakli ma'lumotlar kompyuterga yuklab olinadi. Mashinani o'rganish ko'plab muammolarni hal qilish uchun ishlatilishi mumkin. Ular orasida:
- kasallikka xos bo'lgan asosiy simptomlarni aniqlash;
- ajratilgan ma'lumotlar asosida tashxis qo'yish;
- eng maqbul davolash taktikasini tanlash;
- kasallikning rivojlanish prognozi, uning davomiyligi, tiklanish yoki remissiya istiqbollari;
- eng mumkin bo'lgan asoratlarni hisoblash.
Har bir bemor bo'yicha katta hajmdagi ma'lumotlarni bir zumda tahlil qilib, darhol tashxis qo'yib, eng samarali davolanishni tayinlaydigan shifokor yo'q. Shuning uchun tibbiyotda mashinani o'rganishni amalga oshirish juda dolzarb va talab qilinadigan sohadir.
Foydali qazilma konlarini qidirish va baholash. Bunday holda, belgilar geologik qidiruv natijasida olingan ma'lumotlardir. Ikkilik turlarga xos xususiyat - ma'lum bir joyda ma'lum minerallarning mavjudligi. Miqdoriy va sifat ko'rsatkichlari jinslarning fizik va kimyoviy xossalari bo'ladi. Mashinani o'rganish ikki turdagi ma'lumotlardan foydalanadi: foydali qazilma konlari ma'lum bo'lgan joylar va o'xshash parametrlarga ega, ammo ma'lum foydali qazilmalar konlari yo'q. Noyob foydali qazilmalarni qazib olishning o'ziga xos xususiyatlarini hisobga olish muhimdir. Ko'pincha xususiyatlar soni depozitlar sonidan ko'proq bo'ladi, ya'ni bu holda standart statistik usullar samarali emas.
Mashinani o'rganish mavjud ma'lumotlarda naqshlarni izlashni o'z ichiga oladi. Savolga javob berish uchun eng xarakterli bo'lgan eng ma'lumot beruvchi xususiyatlar yoki ularning guruhlari aniqlanadi - ma'lum bir joyda minerallar mavjud. Agar biz konlarni qidirishni dori bilan taqqoslasak, depozitlarning "alomatlari" aniqlanadi. Ushbu sohada mashinani o'rganish bilan qilingan kashfiyotlar nafaqat amaliy va moliyaviy nuqtai nazardan qimmatlidir. Ular geologiya fani nuqtai nazaridan juda qiziq.
Qarz oluvchining kreditga layoqatliligi va ishonchliligini baholash. Har kuni banklarga kredit olish uchun ko'plab arizalar kelib tushadi. Tabiiyki, qarz oluvchining to'lov qobiliyatini baholash jarayonini avtomatlashtirish 20-asrning ikkinchi yarmidan boshlab uzoq vaqt davomida dolzarb bo'lib kelgan. Keyin AQSh va boshqa mamlakatlarda kredit kartalari faol ravishda joriy etila boshlandi.
Asosan, banklar qarz oluvchining kredit qobiliyatini baholash uchun skoring tizimidan foydalanadilar. Ob'ektlar bankdan kredit so'ragan jismoniy shaxslardir. Jismoniy yoki yuridik shaxs so'rovnoma asosida, shuningdek, boshqa bank kanallari orqali shakllanadigan turli xil xususiyatlarga ega bo'ladi. Bu xususiyatlar ikkilik (jinsi, aloqa telefon raqami), tartib (lavozimi, ma'lumoti), miqdoriy (kredit miqdori, boshqa banklardagi mavjud kreditlari, yoshi, oilaviy ahvoli, ish haqi va boshqa daromad manbalari va boshqalar), nominal (to'liq ism, ish joyi, manzili) ga bo'linadi. Mashinani o'rganish kredit tarixi ma'lum bo'lgan shaxslar ma'lumotlaridan foydalanadi. Qarz oluvchilar sinflarga bo'lingan. Oddiy qilib aytganda, ular "yaxshi" va "yomon" ni farqlaydilar. Tabiiyki, bank faqat "yaxshi" qarz oluvchilar toifasiga ruxsat beradi.
Mashinani o'rganishdan foydalanish odatiy vazifalarni avtomatlashtirish, mavjud resurslarni samarali boshqarish, yangi sohalarni rivojlantirish va qo'shimcha daromad manbalarini topish va vaqtni tejash imkonini beradi. Mashinani o'rganishni faol amalga oshirish barcha jarayonlarni optimallashtirish va avtomatlashtirish orqali biznes operatsiyalarini sifatli o'zgartirish uchun ajoyib echimdir. Ma'lumotlarni qayta ishlash va tahliliy dasturlardan foydalanish kompaniyalarga o'z maqsadlariga tezroq erishish imkonini beradi: miqdoriy, sifat va moliyaviy.
Foydalanilgan manba:gb.ru