Makine Öğrenmesi Nedir? Makine Öğrenimi Modeli Nasıl Oluşturulur?

Makine Öğrenmesi Nedir? Makine Öğrenimi Modeli Nasıl Oluşturulur?

13 Haziran 2021 tarihinde oluşturuldu.
Makine Öğrenmesi Nedir?  Makine Öğrenimi Modeli Nasıl Oluşturulur?

Makine öğrenmesi

Makine öğrenimi, deneyimlerden öğrenen ve zaman içinde karar verme veya tahmine dayalı doğruluklarını iyileştiren uygulamalara odaklanır.

Makine öğrenimi nedir?

Makine öğrenimi, verilerden öğrenen ve programlanmadan zaman içinde doğruluğunu artıran uygulamalar oluşturmaya odaklanan bir yapay zeka (AI) dalıdır.

Veri biliminde bir algoritma, istatistiksel işlem adımlarının bir dizisidir. Makine öğreniminde, algoritmalar, yeni verilere dayalı kararlar ve tahminler yapmak için büyük miktarda verideki kalıpları ve özellikleri bulmak üzere ‘eğitilir’. Algoritma ne kadar iyi olursa, daha fazla veri işledikçe kararlar ve tahminler o kadar doğru olur.

Bugün, makine öğreniminin örnekleri her yerdedir. Dijital asistanlar, sesli komutlarımıza yanıt olarak web’de arama yapar ve müzik çalar. Web siteleri, daha önce satın aldıklarımıza, izlediklerimize veya dinlediklerimize göre ürünler, filmler ve şarkılar önerir. Robotlar biz yaparken yerleri süpürüyor. . .. Spam algılayıcılar, istenmeyen e-postaların gelen kutularımıza ulaşmasını engeller. Tıbbi görüntü analiz sistemleri, doktorların gözden kaçırmış olabilecekleri tümörleri tespit etmelerine yardımcı olur. Ve ilk sürücüsüz arabalar yola çıkıyor.

Daha fazlasını bekleyebiliriz. Büyük veri büyüdükçe, bilgi işlem daha güçlü ve uygun fiyatlı hale geldikçe ve veri bilimcileri daha yetenekli algoritmalar geliştirmeye devam ettikçe, makine öğrenimi kişisel ve iş hayatımızda daha fazla verimlilik sağlayacaktır.

Makine öğrenimi nasıl çalışır?

Bir makine öğrenimi uygulaması (veya modeli) oluşturmanın dört temel adımı vardır. Bunlar tipik olarak, modelin geliştirilmekte olduğu iş profesyonelleri ile yakın çalışan veri bilimcileri tarafından gerçekleştirilir.

Adım 1: Bir eğitim veri seti seçin ve hazırlayın

Eğitim verileri, makine öğrenimi modelinin çözmek için tasarladığı sorunu çözmek için kullanacağı verileri temsil eden bir veri kümesidir. Bazı durumlarda, eğitim verileri veri olarak etiketlenir – modelin tanımlaması gereken özellikleri ve sınıflandırmaları belirtmek için “etiketlenir”. Diğer veriler etiketlenmemiştir ve modelin bu özellikleri çıkarması ve kendi başına sınıflandırmaları ataması gerekecektir.

Her iki durumda da, eğitim verilerinin uygun şekilde hazırlanması – rastgele hale getirilmesi, kopyalarının çıkarılması ve eğitimi etkileyebilecek dengesizlikler veya önyargılar açısından kontrol edilmesi gerekir. Aynı zamanda iki alt gruba ayrılmalıdır: uygulamayı eğitmek için kullanılacak eğitim alt kümesi ve test etmek ve iyileştirmek için kullanılan değerlendirme alt kümesi.

Adım 2: Eğitim veri kümesinde çalıştırılacak bir algoritma seçin

Yine, bir algoritma bir dizi istatistiksel işlem adımıdır. Algoritma türü, eğitim veri setindeki veri türüne (etiketli veya etiketsiz) ve miktarına ve çözülecek problemin türüne bağlıdır.

Etiketli verilerle kullanım için yaygın olarak kullanılan makine öğrenimi algoritmaları şunları içerir:

Regresyon algoritmaları: Doğrusal ve lojistik regresyon, verilerdeki ilişkileri anlamak için kullanılan regresyon algoritmalarının örnekleridir. Doğrusal regresyon, bağımsız bir değişkenin değerine dayalı olarak bağımlı bir değişkenin değerini tahmin etmek için kullanılır. Lojistik regresyon, bağımlı değişken doğası gereği ikili olduğunda kullanılabilir: A veya B. Örneğin, bir satış elemanının yıllık satışlarını (bağımlı değişken) satış görevlisinin eğitimiyle veya yıllarla ilişkisine dayalı olarak tahmin etmek için doğrusal bir regresyon algoritması eğitilebilir. deneyim (bağımsız değişkenler) Destek vektör makinesi olarak adlandırılan başka bir tür regresyon algoritması, bağımlı değişkenlerin sınıflandırılması daha zor olduğunda kullanışlıdır.

Karar ağaçları: Karar ağaçları, bir dizi karar kuralına dayalı önerilerde bulunmak için sınıflandırılmış verileri kullanır. Örneğin, belirli bir at üzerinde kazanmak, yer almak veya göstermek için bahis yapmayı öneren bir karar ağacı, at hakkındaki verileri (örneğin yaş, kazanma yüzdesi, soyağacı) kullanabilir ve bir eylem veya karar önermek için bu faktörlere kurallar uygulayabilir.
Örnek tabanlı algoritmalar: Örnek tabanlı algoritmanın iyi bir örneği K-En Yakın Komşu veya k-nn’dir. Bir veri noktasının, diğer veri noktalarına olan yakınlığına bağlı olarak bir grubun üyesi olma olasılığını tahmin etmek için sınıflandırmayı kullanır.

Etiketsiz verilerle kullanım için algoritmalar şunları içerir:

Kümeleme algoritmaları: Kümeleri gruplar olarak düşünün. Kümeleme, benzer kayıt gruplarını belirlemeye ve kayıtları ait oldukları gruba göre etiketlemeye odaklanır. Bu, gruplar ve özellikleri hakkında önceden bilgi olmadan yapılır. Kümeleme algoritması türleri arasında K-ortalamaları, TwoStep ve Kohonen kümelemesi bulunur.

İlişkilendirme algoritmaları: İlişkilendirme algoritmaları, verilerdeki kalıpları ve ilişkileri bulur ve ilişkilendirme kuralları adı verilen sık “eğer-öyleyse” ilişkilerini tanımlar. Bunlar veri madenciliğinde kullanılan kurallara benzer.

Sinir ağları: Bir sinir ağı, verilerin beslendiği bir giriş katmanı içeren katmanlı bir hesaplama ağını tanımlayan bir algoritmadır; en az bir gizli hesaplamaların yapıldığı yer, girdi hakkında farklı sonuçlar çıkarır; ve bir çıktı katmanı. burada her sonuca bir olasılık atanır. Derin bir sinir ağı, her biri bir önceki katmanın sonuçlarını art arda iyileştiren çok sayıda gizli katmana sahip bir ağı tanımlar.

 

Adım 3: Modeli oluşturmak için algoritmayı eğitme

Algoritmayı eğitmek yinelemeli bir süreçtir – algoritma aracılığıyla değişkenleri çalıştırmayı, çıktıyı üretmiş olması gereken sonuçlarla karşılaştırmayı, algoritma içindeki ağırlıkları ve önyargıları ayarlamayı ve algoritmaya kadar değişkenleri yeniden çalıştırmayı içerir. çoğu zaman doğru sonucu döndürür. Ortaya çıkan eğitimli, doğru algoritma, makine öğrenimi modelidir – dikkat edilmesi gereken önemli bir ayrımdır, çünkü “algoritma” ve “model”, makine öğrenimi uzmanları tarafından bile birbirinin yerine yanlış bir şekilde kullanılır.

Adım 4: Modeli kullanma ve geliştirme

Son adım, modeli yeni verilerle kullanmak ve en iyi durumda, zaman içinde doğruluğu ve etkinliği iyileştirmek için kullanmaktır. Yeni verilerin nereden geldiği çözülmekte olan soruna bağlı olacaktır. Örneğin, istenmeyen postayı tanımlamak için tasarlanmış bir makine öğrenimi modeli, e-posta mesajlarını alırken, robot elektrikli süpürgeyi çalıştıran bir makine öğrenimi modeli, taşınan mobilyalar veya odadaki yeni nesnelerle gerçek dünya etkileşiminden kaynaklanan verileri alır.
Makine öğrenimi yöntemleri

Makine öğrenimi yöntemleri (makine öğrenimi stilleri olarak da adlandırılır) üç ana kategoriye ayrılır.
Denetimli makine öğrenimi

Denetlenen makine öğrenimi, kendisini etiketli bir veri kümesi üzerinde eğitir. Yani veriler, makine öğrenimi modelinin belirlemek için oluşturulduğu ve hatta modelin verileri sınıflandırması gerektiği şekilde sınıflandırılabilecek bilgilerle etiketlenir. Örneğin, safkan Alman Çoban köpeklerini tanımlamak için tasarlanmış bir bilgisayar vizyon modeli, çeşitli etiketli köpek görüntülerinden oluşan bir veri kümesi üzerinde eğitilebilir.

Denetimli makine öğrenimi, diğer makine öğrenimi yöntemlerine göre daha az eğitim verisi gerektirir ve modelin sonuçları gerçek etiketli sonuçlarla karşılaştırılabildiğinden eğitimi kolaylaştırır. Ancak, uygun şekilde etiketlenmiş verilerin hazırlanması pahalıdır ve aşırı uygunluk veya yeni verilerdeki varyasyonları doğru bir şekilde işlemeyecek kadar eğitim verilerine çok yakından bağlı ve önyargılı bir model oluşturma tehlikesi vardır.

Denetimsiz makine öğrenimi

Denetimsiz makine öğrenimi, etiketlenmemiş verileri (çok ve çok) alır ve verileri insan müdahalesi olmadan gerçek zamanlı olarak etiketlemek, sıralamak ve sınıflandırmak için gereken anlamlı özellikleri çıkarmak için algoritmalar kullanır. Denetimsiz öğrenme, kararların ve tahminlerin otomatikleştirilmesinden çok, insanların gözden kaçıracağı verilerdeki kalıpları ve ilişkileri belirleme hakkındadır. Örneğin, spam tespitini ele alalım – insanlar, bir veri bilimcilerinin yaşamları boyunca etiketlemeyi veya sınıflandırmayı umabileceklerinden daha fazla e-posta üretir. Denetimsiz bir öğrenme algoritması, büyük hacimli e-postaları analiz edebilir ve istenmeyen postayı belirten özellikleri ve kalıpları ortaya çıkarabilir (ve zamanla istenmeyen postaları işaretlemede daha iyi olmaya devam edebilir).

Yarı denetimli öğrenme

Yarı denetimli öğrenme, denetimli ve denetimsiz öğrenme arasında mutlu bir ortam sunar. Eğitim sırasında, daha büyük, etiketlenmemiş bir veri kümesinden sınıflandırma ve özellik çıkarma işlemlerine rehberlik etmek için daha küçük etiketli bir veri kümesi kullanır. Yarı denetimli öğrenme, denetimli bir öğrenme algoritması eğitmek için yeterli etiketli veriye sahip olmama (veya yeterli veriyi etiketleyememe) sorununu çözebilir.
Güçlendirme makine öğrenimi

Güçlendirmeli makine öğrenimi, denetimli öğrenmeye benzer davranışsal bir makine öğrenimi modelidir, ancak algoritma örnek veriler kullanılarak eğitilmemiştir. Bu model, deneme yanılma yoluyla ilerledikçe öğrenir. Belirli bir problem için en iyi öneriyi veya politikayı geliştirmek için bir dizi başarılı sonuç pekiştirilecektir.

Jeopardy’yi kazanan IBM Watson® sistemi! 2011’deki meydan okuma buna iyi bir örnek. Sistem, bir cevaba (veya olduğu gibi bir soruya), tahtada hangi karenin seçileceğine ve özellikle günlük çiftlerde ne kadar bahis oynanacağına karar vermek için pekiştirmeli öğrenmeyi kullandı.

Derin öğrenme

Derin öğrenme, makine öğreniminin bir alt kümesidir (tüm derin öğrenme makine öğrenimidir, ancak tüm makine öğrenimi derin öğrenmedir). Derin öğrenme algoritmaları, insan beyninin öğrenme şeklini öğrenmek için tasarlanmış yapay bir sinir ağını tanımlar. Derin öğrenme modelleri, sonuçları sürekli olarak ayarlamak ve iyileştirmek için birbirini izleyen her bir katmanda ağırlık ve önyargılar uygulayan, birden çok hesaplama katmanından geçen büyük miktarda veri gerektirir.

Derin öğrenme modelleri tipik olarak denetimsiz veya yarı denetimlidir. Pekiştirmeli öğrenme modelleri, derin öğrenme modelleri de olabilir. Belli tür derin le

Konvolüsyonel sinir ağları (CNN’ler) ve tekrarlayan sinir ağları (RNN’ler) dahil olmak üzere kurma modelleri, bilgisayarla görme, doğal dil işleme (konuşma tanıma dahil) ve sürücüsüz arabalar gibi alanlarda ilerlemeyi yönlendiriyor.


Gerçek dünya makine öğrenimi kullanım örnekleri

Başlangıçta belirtildiği gibi, makine öğrenimi her yerde. İşte her gün karşılaşabileceğiniz makine öğrenimine ilişkin birkaç örnek:

Dijital asistanlar: Apple Siri, Amazon Alexa, Google Assistant ve diğer dijital asistanlar, bilgisayarların metin ve ses verilerini işlemesine ve insan dilini insanların yaptığı gibi ‘anlamasına’ olanak tanıyan bir makine öğrenimi uygulaması olan doğal dil işleme (NLP) tarafından desteklenmektedir. Doğal dil işleme, GPS ve konuşma tanıma (konuşmadan metne) yazılımı gibi sesle çalışan uygulamaları da yönlendirir.
Öneriler: Derin öğrenme modelleri, Amazon, Netflix, Spotify ve diğer perakende, eğlence, seyahat, iş arama ve haber hizmetleri tarafından sunulan ‘insanların da beğendiği’ ve ‘sadece sizin için’ önerilerini yönlendirir.
Bağlamsal çevrimiçi reklamcılık: Makine öğrenimi ve derin öğrenme modelleri bir web sayfasının içeriğini (yalnızca konuyu değil, yazarın görüşü veya tutumu gibi nüansları) değerlendirebilir ve ziyaretçinin ilgi alanlarına göre uyarlanmış reklamlar sunabilir.
Sohbet robotları: Sohbet robotları, giriş metnini yorumlamak ve uygun yanıtlar sağlamak için örüntü tanıma, doğal dil işleme ve derin sinir ağlarının bir kombinasyonunu kullanabilir.
Dolandırıcılık tespiti: Makine öğrenimi gerileme ve sınıflandırma modelleri, çalınan kredi kartı kullanımını işaretlerken yüksek sayıda yanlış pozitif içeren ve çalınan veya tehlikeye atılan finansal verilerin suçlu kullanımını tespit etmede nadiren başarılı olan kural tabanlı dolandırıcılık tespit sistemlerinin yerini almıştır.
Siber güvenlik: Makine öğrenimi, potansiyel tehditleri belirlemek, güvenlik analistlerine tavsiyelerde bulunmak ve yanıtları hızlandırmak için olay raporlarından, uyarılardan, blog yayınlarından ve daha fazlasından istihbarat çıkarabilir.
Tıbbi görüntü analizi: Dijital tıbbi görüntüleme verilerinin türleri ve hacmi patladı, bu da tanıları desteklemek için daha fazla kullanılabilir bilgiye ve aynı zamanda verileri okurken insan hatası için daha fazla fırsat sağladı. Evrişimli sinir ağları (CNN’ler), tekrarlayan sinir ağları (RNN’ler) ve diğer derin öğrenme modelleri, doğru tanıları desteklemeye yardımcı olmak için tıbbi görüntülerden özellikleri ve bilgileri çıkarmada giderek daha başarılı olduklarını kanıtladı.
Kendi kendine giden arabalar: Kendi kendine giden otomobiller, bir makine öğrenimi tur de force gerektirir — arabanın etrafındaki ortamdaki nesneleri sürekli olarak tanımlamalı, nasıl değişeceklerini veya hareket edeceklerini tahmin etmeli ve aracı nesnelerin etrafında ve sürücünün yanına doğru yönlendirmelidirler. hedef. Yukarıda bahsedilen neredeyse her tür makine öğrenimi ve derin öğrenme algoritması, kendi kendine giden bir otomobili etkinleştirmede bir rol oynar.