Teknolojiyle ilgiliyseniz ve veri bilimiyle alakalı bir mesleğe sahip olmak istiyorsanız mutlaka makine öğrenmesi hakkında birkaç şey duymuşsunuzdur. Terimin gizemli bir havası var. Birçok kişi konseptin kendisinden şaşkına dönmüş durumda. Ancak AI mühendisi veya iş zekası uzmanı nasıl olunur merak ediyorsanız makine öğrenmesi ve hakkındaki her şeyle ilgili bilgi sahibisinizdir. İşe girmek ise başka bir olay. İş görüşmelerine hazırlanmanız gerekiyor. Peki makine öğrenmesi mülakat soruları üzerine çalışmaktan daha iyi bir hazırlık yolu var mı sizce?
Rehberimizde makine öğrenmesi hakkında gelebilecek iş görüşmesi soruları ve cevapları üzerine konuşacağız. Hem temel düzey hem de ileri düzey sorulara el atacağız. Hadi daha fazla vakit kaybetmeden başlayalım.
İçindekiler
- 1. Makine Öğrenmesinin Ana Yönleri
- 1.1. Soru 1: Makine öğrenmesi nedir?
- 1.2. Soru 2: “Derin öğrenme” nedir?
- 1.3. Soru 3: “Type 1” ve “type 2” hataları arasındaki fark nedir?
- 1.4. Soru 4: “Data augmentation” nedir?
- 1.5. Soru 5: “Naive Bayes” adını nasıl almıştır?
- 1.6. Soru 6: Hangileri daha iyidir: Derin ağlar mı sığ ağlar mı?
- 1.7. Soru 7: “Fourier dönüşümü” nedir?
- 1.8. Soru 8: “Evrişimli sinir ağı” nedir?
- 1.9. Soru 9: “True Positive Rate” ve “Recall” arasındaki korelasyon hakkında ne bilmeliyiz?
- 1.10. Soru 10: “Geri yayılım” nedir?
- 1.11. Soru 11: “Test seti” kullanmadan sadece “validasyon seti” kullanırsak ne olur?
- 1.12. Soru 12: Tümdengelimsel ve tümevarımsal makine öğrenmesi arasındaki fark nedir?
- 1.13. Soru 13: Variance ve bias makine öğrenmesinde nasıl bir rol oynar?
- 1.14. Soru 14: Supervised learning nedir ve unsupervised’dan hangi yönlerde farklıdır?
- 1.15. Soru 15: Bir sınıflandırma problemi için algoritma nasıl seçilir?
- 2. İleri Düzey Makine Öğrenmesi Mülakat Soruları
- 2.1. Soru 1: “Generative” ve “discriminative” modeller arasındaki fark nedir?
- 2.2. Soru 2: “Cross-validation” ve “stratified cross-validation” arasındaki farkları açıklayın.
- 2.3. Soru 3: “Lasso” ve “Ridge” regresyonları hangi durumlarda kullanılmalıdır?
- 2.4. Soru 4: “F1” nedir?
- 2.5. Soru 5: Çoğu durumda hangisinin puanı yüksektir: Kolektif modellerin mi bireysel modellerin mi?
- 2.6. Soru 6: “Correlation” ve “covariance” arasındaki fark nedir?
- 2.7. Soru 7: “Dengesiz veri seti”ni tanımlayın.
- 2.8. Soru 8: “Veri normalleştirme” nedir?
- 2.9. Soru 9: Kategorik değişken ve sürekli değişken arasındaki korelasyonun yakalanması mümkün mü?
- 2.10. Soru 10: Aktivasyon fonksiyonu ne için kullanılır?
- 3. Son
Makine Öğrenmesinin Ana Yönleri
Mülakat tarihiniz belli olduğunda makine öğrenmesi ile ilgili iş görüşmesi soruları ve cevapları üzerinde çalışmaya başlayabilirsiniz. Başlamak için en iyi yol temel düzey makine öğrenmesi mülakat sorularından geçiyor. Bu sorularla görüşmenizin başında karşılaşabilirsiniz. İşverenler temel düzey sorularla eleştirel düşüncenizi ölçmek ve kendi fikirlerinizi nasıl dile getirdiğinizi görmek istiyor. Bu yüzden soruların çoğu tanımlamalara, karşılaştırmalara ve açıklamalara dayanıyor.
Şu Anda Etkin Olan Güncel Teklifler:Follow the Datacamp promo code link & get an exclusive 25% OFF Datacamp subscriptions. Act now while the offer is still available!
Soru 1: Makine öğrenmesi nedir?
Bu sorunun karşınıza çıkmayacağını düşünmüyordunuz herhalde?
İşverenlerin çoğu ilk soru olarak bu ve buna benzer şeyler yöneltebilir. Bunun birkaç sebebi var.
Öncelikle mülakatı gerçekleştiren kişiler makine öğrenmesi nedir bilip bilmediğinizi görmeden diğer sorulara geçmek istemiyor. Üstelik soruya cevap verme şeklinizle kendi tanımlamalarınızı ne kadar iyi oluşturduğunuzu, başka bir değişle zor bir konuyu kolay ve anlaşılır bir şekilde nasıl açıkladığınızı gösteriyor. Eğer gider gece boyunca ezberlediğiniz yirmi satırlık açıklamayı önlerine koyarsanız kendinizi açıklamanıza kıyasla çok daha az kredi alırsınız.
Pek gelelim asıl soruya, makine öğrenmesi nedir?
Makine öğrenmesi hakkında yapılabilecek en kolay ve anlaşılır tanım AI geliştirmenin özel bir felsefesi olacaktır. Makinelerin önceden programlanmadan kendilerine verilen bilgilerle öğrenmelerinin nasıl sağlanacağını inceleyen bir bilim alanıdır.
Soru 2: “Derin öğrenme” nedir?
Bu soru derin öğrenme mülakat soruları arasında yer alıyor. Derin öğrenme ve makine öğrenmesi iç içe bulunan konular olduğu için böyle çapraz makine öğrenmesi ve derin öğrenme sorularıyla karşılaşabilirsiniz.
Derin öğrenme makine öğrenmesinin bir dalıdır. Bu bilim dalı makinenin nöral ağlarının insan beynine olabildiğince benzetmeye çalışır.
Soru 3: “Type 1” ve “type 2” hataları arasındaki fark nedir?
Type 1 hata, gerçekleşmesi imkansız bir hatanın gerçekleştiğini iddia eder. Type 2 ise bunun zıttı olarak bir şey açık şekilde gerçekleşmişken hiçbir şey olmadığını iddia eder.
Böyle makine öğrenmesi mülakat soruları kafa karıştırabilir ancak kolay hatırlamanızı sağlayacak bazı yöntemler var.
İki type arasındaki farkı kolay bir şekilde hatırlamanız için bir örnek verelim: Type 1 hatasını köpeğinize bir kedi olduğunu söylemeniz olarak düşünün. Type 2 hatasını da aynı köpeğe köpeklerin havlayamayacağını söylemek olarak düşünün.
Soru 4: “Data augmentation” nedir?
Genele kıyasla biraz daha kolay makine öğrenmesi sorunlarından biri. Data augmentation (veri artırma) eski verilerden yeni veriler oluşturma yöntemidir. Bunu gerçekleştirmek için ya hedef olduğu gibi bırakılır ya da önceden bilinen bir şeye dönüştürülür.
Soru 5: “Naive Bayes” adını nasıl almıştır?
Naive Bayes’in naif olarak adlandırılmasının sebebi düşünme şeklidir. Bir veri setindeki elementlerin hepsinin aynı öneme sahip olduğu varsayımında bulunur. Neredeyse hiçbir senaryoda böyle bir durum yoktur.
Soru 6: Hangileri daha iyidir: Derin ağlar mı sığ ağlar mı?
Bu makine öğrenmesi sorusunu karşılaştırma sorunu olarak sınıflandırabilirsiniz. Çünkü cevap vermeniz ve arasındaki farkı açık bir şekilde belirtmeniz için iki ağ hakkında da biraz bilgi sahibi olmanız gerekiyor.
Derin ağlar genellikle daha iyi olarak görülür. Bunu sebebi çoğu gizli olan daha fazla katmandan oluşmalarıdır. Bu derin ağların daha iyi özellikler oluşturmasına yardımcı olur.
Soru 7: “Fourier dönüşümü” nedir?
Fourier dönüşümü basit ve jenerik fonksiyonları süper fonksiyonlar olarak bilinen şeylere dönüştürme yöntemidir. Eğer karşınıza böyle bir makine öğrenmesi mülakat sorusu çıkarsa konuyu açıklama yaparak biraz daha açabilir ve örneklendirebilirsiniz.
Soru 8: “Evrişimli sinir ağı” nedir?
Normal ve basit ağlar işlemlerini gerçekleştirmek için bağlantılı katmanları kullanır. Evrişimli sinir ağları ise bağlantılı katmanlar yerine evrişimli olanları kullanır.
İnsanların standart bağlantılı ağlar yerine evrişimli ağları seçmeninin ana sebebi evrişimli ağlara atfedilmiş parametre sayısının çok daha az olmasıdır.
Soru 9: “True Positive Rate” ve “Recall” arasındaki korelasyon hakkında ne bilmeliyiz?
Daha ileri düzey makine öğrenmesi mülakat soruları arasında yer alıyor gibi görünse de bu sorunun cevabı oldukça basittir. Her iki ölçü de birbirinin aynısıdır. TP/TP + FN formülüne bakarak bunu görebiliriz.
Soru 10: “Geri yayılım” nedir?
Kulağa süslü gelen bir ifade olan geri yayılım çok katmanlı nöral ağları eğitme yöntemidir. Bu yöntemle “hata”yı en sondan alıp tüm ağa eşit olarak dağıtarak ağı eğitebiliriz. Böylelikle makinenin ölçümlemesini etkili bir şekilde gerçekleştirme fırsatı olur.
Soru 11: “Test seti” kullanmadan sadece “validasyon seti” kullanırsak ne olur?
Sadece validasyon seti uygularsanız test yaptığınız modelin ölçüleri hakkında doğru bir tahmin alamazsınız. Çünkü test seti modelin daha önce karşılaşmadığı örneklerde karşı nasıl çalıştığını test eder. Bu yüzden test seti çıkarılırsa otomatik olarak muhtemel geçerli test sonuçlarını da etkilemiş olursunuz.
Soru 12: Tümdengelimsel ve tümevarımsal makine öğrenmesi arasındaki fark nedir?
Ana fark nasıl başladıklarıdır. Tümevarımsal makine öğrenmesi sonuca giden örneklerle başlar. Tümdengelimsel makine öğrenmesi ise sonuçtan başlar, sonrasında da o sonuç hakkında neyin doğru neyin yanlış olduğu görüşüne varır.
Soru 13: Variance ve bias makine öğrenmesinde nasıl bir rol oynar?
İkisi de hatadır. Variance (varyans) makine öğrenmesi algoritmasında yer alan fazla karmaşıklığın sonucu olan bir hatadır. Bias (yanlılık) ise öğrenme algoritmasındaki kusurlu varsayımlardan oluşan hatadır. Diğer makine öğrenmesi mülakat soruları içerisinde de yer aldığı için bu ifadeleri karıştırmamaya çalışın.
Soru 14: Supervised learning nedir ve unsupervised’dan hangi yönlerde farklıdır?
Supervised learning (gözetimli öğrenme), yazılımın öğrenip bir dahaki sefere daha doğru sonuçlar vermesi için çıktıların bilgisayara geri yüklenmesi işlemidir. Unsupervised learning ( gözetimsiz öğrenme) ise bilgisayarın önceden eğitim almadan öğrenmesidir.
Soru 15: Bir sınıflandırma problemi için algoritma nasıl seçilir?
Bu soruda cevap ihtiyaç duyulan doğruluk derecesine ve eğitim setinin boyutuna dayanıyor. Eğitim seti küçükse düşük variance/yüksek bias sınıflandırıcısı seçilmelidir. Eğitim seti büyükse tam tersini yapılıp yüksek variance/düşük bias sınıflandırıcısı seçilmelidir.
İleri Düzey Makine Öğrenmesi Mülakat Soruları
Temel seviye makine öğrenmesi iş görüşmesi soruları ve cevapları hakkında bir fikir sahibi olduğunuza göre sıra geldi ileri düzey sorulara.
Merak etmeyin işverenleriniz sizden kendi kendine yetebilen bir AI sistemi kurmanızı veya derin öğrenme üzerinde çalışmak için tüm farklı yolları anlattığını üç yüz sayfalık bir kitap yazmanızı istemeyecekler. “İleri düzey” sadece soruların biraz daha zor olacağı, cevapları verirken açıklama yapıp örneklendirmeniz gerektiği anlamına geliyor. Endişelenmeyin, rahatlatın ve öğrenmeye başlayın.
Soru 1: “Generative” ve “discriminative” modeller arasındaki fark nedir?
Tuzak bir makine öğrenmesi sorusu gibi gözükse de çalışanlarınız bu modellerin verilerle nasıl başa çıktığını öğrenmek isteyecektir.
Generative model, sağlanan farklı veri kategorilerini öğrenir. Discriminative model ise sadece çeşitli veri kategorileri arasındaki farkı öğrenir.
Geliştiriciler ve mühendisler genellikle discriminative modeli kullanmayı tercih eder çünkü görevleri hızlı ve etkili bir şekilde gerçekleştirir.
Soru 2: “Cross-validation” ve “stratified cross-validation” arasındaki farkları açıklayın.
Cross-validation (çapraz doğrulama) eğitim süresi ve validation seti arasındaki verileri rastgele ayırmak için kullanılır. Stratified cross-validation (katmanlı çapraz doğrulama) aynı şeyi gerçekleştirir ama bunu rastgele değişken olmadan yapar. Eğitim ve validation testi arasındaki oranı kontrol eder ve korur. Bu makine öğrenmesi mülakat sorusu çok kolay karıştırılabiliyor o yüzden dikkat edin!
Soru 3: “Lasso” ve “Ridge” regresyonları hangi durumlarda kullanılmalıdır?
Doğru cevap vermek için her iki regresyon hakkında kapsamlı bilgiye sahip olunması gerektiğinden bu soru ileri düzey makine öğrenmesi soruları kategorisinde yer alıyor.
Lasso regresyonu hem değişken seçme hem de parametre küçültme fonksiyonlarını gerçekleştirebilir. Ridgre regresyonu ise sadece parametre küçültme fonksiyonunu gerçekleştirir. Bu yüzden az değişkeniniz ve büyük bir etkiniz varsa Lasso regresyonu kullanmalı, çok sayıda küçük değişkeniniz varsa Ridge regresyonu kullanmalısınız.
Bu soruda cevabınızı birkaç cümleyle açıklama fırsatına sahipsiniz.
Soru 4: “F1” nedir?
F1 skoru modeliniz ne kadar iyi iş çıkardığını belirten bir ölçüdür. “1”e yakın herhangi bir puan iyidir. “0.5”in altında puan alanlarla tekrardan çalışılmalıdır.
Soru 5: Çoğu durumda hangisinin puanı yüksektir: Kolektif modellerin mi bireysel modellerin mi?
Soru 5: Çoğu durumda hangisinin puanı yüksektir: Kolektif modellerin mi bireysel modellerin mi?
Kolektifler genellikler daha büyük skora ulaşıyor. Bunun sebebi çeşitli farklı modellerin kombinasyonlarının tek bir sonucu tahmin etmesidir. Model sayısı arttıkça giderilen hata sayısı da artar, son tahmin skoru da daha yüksek olur.
Soru 6: “Correlation” ve “covariance” arasındaki fark nedir?
Cevap oldukça basit; covariance (kovaryans) standart hale getirildiğinde correlation (korelasyon) haline gelir.
Soru 7: “Dengesiz veri seti”ni tanımlayın.
Dengesiz veri seti test sonrasında tüm bilgilerin yarısından fazlasını bir sınıfa atandığı sonuçları getiren settir.
Peki bu nasıl önlenir? Bazı basit çözümler mevcut; farklı bir algoritmayla testi tekrar gerçekleştirebilir veya sonucun dengelenmesi için daha da fazla sayıda veriyi test edebilirsiniz.
Soru 8: “Veri normalleştirme” nedir?
Hatırlarsanız geri yayılımdan bahsetmiştik. Veri normalleştirme, geri yayılım işlemindeki veri fazlalığını minimuma indirmek için kullanılır. Kullanıcıya istediği gibi farklı değerler ayarlama olanağı sağlar, böylece olası fazlalık sorunları ortadan kalkar.
Soru 9: Kategorik değişken ve sürekli değişken arasındaki korelasyonun yakalanması mümkün mü?
Evet ama bunu gerçekleştirmek için Analysis of Covariance (ANVOCA) isimli yöntemi kullanmanız gerekir. Bu yolla gerçekleştirebilirsiniz.
- Kullanması kolay
- Kaliteli içeriğe sahip
- Fiyat konusunda saydam
- Tamamlamada ücretsiz sertifikalar
- Veri bilimi becerilerine odaklanıyor
- Esnek eğitim programları
- Basit tasarım (gereksiz bilgi yok)
- Yüksek kaliteli dersler (ücretsizler dahil)
- Çeşitli özellikler
- Nanodegree programları
- Firmalara uygun
- Ücretli tamamlama sertifikası
- Sektörde iyi biliniyor
- Pek çok özelliğe sahip
- Dersler üniversite düzeyinde
- Üniversite düzeyince dersler
- Şirketler için uygun
- Ücretli tamamlama sertifikası
Soru 10: Aktivasyon fonksiyonu ne için kullanılır?
Bu fonksiyon doğrusal olmayan öğrenme yöntemlerini tanıtarak ağınızı çeşitlendirme olanağı sağlar. Makinenizin zor işlemleri daha kolay bir şekilde nasıl gerçekleştireceğini öğrenmesine yardımcı olur.
Biliyor Muydunuz?
Kariyeriniz için hangi online eğitim platformunun daha iyi olduğunu merak etmiş miydiniz?
Son
Rehberimizde makine öğrenmesi hakkında karşınıza çıkabilecek mülakat sorularından bahsettik. Temel düzeyden başlayıp sonrasında daha ileri düzey iş görüşmesi soruları ve cevapları hakkında konuştuk.
İster IT uzmanı ister makine öğrenmesi AI uzmanı olun, mülakatınızdan önce bu sorulara çalışmayı unutmayın. Evet sadece buzdağının görünen kısmını el aldık ama eğer bu soru ve cevapları iyice öğrenirseniz mülakatta karşınıza çıkabilecek şeyler hakkında bir fikir sahibi olmuş olursunuz.