Ana içeriğe atla

PYTHON İÇİN SQL FONKSİYONLARI - PART2

 Merhabalar, 

Bu yazı, PYTHON İÇİN SQL FONKSİYONLARI - PART1 yazısının devamıdır. Bu yazımda değineceğim analiz fonksiyonları aşağıdaki gibidir. Bu çalışma için dataseti  buradan indirebilirsiniz .İncelemek istediğiniz koda tıklayarak kodun yazımına doğrudan ilerleyebilirsiniz. İlerlediğiniz sayfadan tekrar buraya dönmek için kural adına tıklamanız yeterlidir.

    

    16. SELECT * FROM X WHERE .... IS NOT NULL

    17.SELECT * FROM X WHERE A BETWEEN .... AND ...

    18.SELECT DISTINCT A FROM X

    19.SELECT DISTINCT A,B FROM X

    23.SELECT A,FONKSİYON() FROM X WHERE .... GROUP BY A


    Part1'i okuyup buraya geldiyseniz tekrar olacak ama istediğiniz bir çıktıyı verecek birden fazla yöntem olduğunu aklınızdan çıkarmadan okumanızı tavsiye ederim. 


loan_data[loan_data.Credit_History.notnull()] #1.yol

loan_data[~loan_data.Credit_History.isna()] #2.yol


loan_data[loan_data.ApplicantIncome.between(3000,5000)]


loan_data.Property_Area.unique()


loan_data[["Gender","Education"]].drop_duplicates()


loan_data[["Gender","Education"]][loan_data.ApplicantIncome>3500].drop_duplicates()

loan_data["oto_onay"]=np.where((loan_data.ApplicantIncome>4000) &(loan_data.LoanAmount<1000),1,0) #1.yol

#2.yol
loan_data.loc[(loan_data.ApplicantIncome>4000) &(loan_data.LoanAmount<1000),"oto_onay2"]=1
loan_data.loc[~(loan_data.ApplicantIncome>4000),"oto_onay2"]=0
loan_data.loc[(loan_data.ApplicantIncome>4000) & (loan_data.LoanAmount.isna()),"oto_onay2"]=2

loan_data["list_comp_"]=[1  if (loan_data.loc[i,"ApplicantIncome"]>4000) and (loan_data.loc[i,"LoanAmount"]<1000) else 0  for i in range(loan_data.shape[0])]
#3.yol


loan_data.groupby("Gender")["LoanAmount"].mean() #1.örnek

loan_data.groupby("Gender")["LoanAmount"].agg(["sum","min","max"]) #2.örnek

loan_data.groupby("Gender").agg({"LoanAmount":["sum","min","max"],"ApplicantIncome":"sum"}) #3.örnek


loan_data[loan_data["Married"]=="Yes"].groupby("Gender")["LoanAmount"].mean()

loan_data[loan_data["Married"]=="Yes"].groupby("Gender")["LoanAmount"].describe()


loan_data.groupby(["Gender","Education"])["ApplicantIncome"].mean()


loan_data[loan_data.Credit_History==1].groupby(["Gender_Missing","Education"])["ApplicantIncome"].mean()


loan_data.assign(result=np.where(loan_data.Credit_History==1,1,0)).groupby("Property_Area")["result"].sum() 


loan_data.assign(result=np.where(loan_data.Credit_History==1,loan_data.LoanAmount,0)).groupby("Property_Area")["result"].max() 

loan_data.assign(result=np.where(loan_data.Credit_History==1,loan_data.LoanAmount,0)).groupby("Property_Area")["result"].min() 


28., 29. ve 30. maddelerdeki join işlemini yapabilmek için loan_data2 dataframe'ini oluşturuyoruz.

loan_data2=loan_data.loc[:100,:]
loan_data2.rename(columns={"Loan_ID":"Loan_ID2"},inplace=True)
pd.merge(loan_data,loan_data2,how="inner",left_on="Loan_ID",right_on="Loan_ID2")


pd.merge(loan_data,loan_data2,how="left",left_on="Loan_ID",right_on="Loan_ID2")


pd.merge(loan_data,loan_data2,how="right",left_on="Loan_ID",right_on="Loan_ID2")

Bir yazımın daha sonuna geldiniz. Bu yazının diğer partlarına ulaşmak için;
PYTHON İÇİN SQL FONKSİYONLARI - PART1 için tıklayınız.
PYTHON İÇİN SQL FONKSİYONLARI - PART3 için tıklayınız .

Yorumlar

Most Popular

PYTHON İLE VERİ GÖRSELLEŞTİRME

Merhabalar, Bu yazımda data analiz aşamasında işimizi oldukça kolaylaştıran bir yöntem olan veri görselleştirme üzerinde duracağım. Grafik türlerini göstermeye çalışırken aklıma gelen tüm özellikleri grafiklere koymaya çalıştım. Sizler grafikleri kullanırken işinize yaramayan kodları çıkartabilirsiniz.  Aynı satırda/sütunda birden fazla grafik çizdirmemizi ve ilişkileri daha rahat görmemizi sağlayan subplot konusuna ayrı değineceğim. Subplot için buraya tıklayabilirsiniz.  İncelemek istediğiniz grafiğin adına tıklayarak grafiğin kodunun yazımına doğrudan ilerleyebilirsiniz. İlerlediğiniz sayfadan tekrar menüye dönmek için grafik adına tıklamanız yeterlidir.  Bu yazımda değineceğim grafik türleri: 1)LINE PLOT 2)BAR CHART      2.1) STACKED BAR CHART      2.2) GROUPED BAR CHART 3)BOX PLOT 4)PIE CHART 5)HEATMAP  6)TREE MAP  7)SCATTER PLOT Grafik türleri görmeye başlamadan önce bazı görselleştirme kütüphanelerini import etmek...

PYTHON MAKİNE ÖĞRENMESİ - PIPELINE VE COLUMNTRANSFORMER

Merhabalar, bu yazımda makine öğrenmesi modelleme sürecinde yazdığınız kodların kalitesini ve okunabilirliğini nasıl artıracağınızı anlatacağım. Bunun için Pipeline ve ColumnTransformer fonksiyonlarını kullanacağız. Kodlara geçmeden önce bu fonksiyonların tanımı ve birbirinden ne gibi farkları olduğuna kısaca değineceğim.  Bu yazının asıl amacı Pipeline ve ColumnTransformer yapılarına örnek vermek olduğu için projeyi geliştirme aşamasındaki adımları kendinize göre uyarlayabileceğinizi unutmadan okumanızı tavsiye ederim.  Pipeline Nedir ?  Pipeline;  bir önceki adımdaki çıktının, bir sonraki adımdaki girdiye dönüştüğü birden fazla adımı birbirine bağlayan zincirleme bir yöntemdir. Modelin başından sonuna kadar her bir işlem adımı, tek bir işlem ile tanımlandığı için kodların takibi kolaydır.  Pipeline  yapısını kurabilmek için kullanacağınız fonksiyonlarda  fit ve transform metodlarının bulunması gereklidir.  Yapacağımız projede örnek olarak kend...

PYTHON İÇİN SQL FONKSİYONLARI - PART1

 Data Analiz aşaması için SQL olmazsa olmaz bir araçtır. İyi bir model yapabilmek için datayı iyi analiz etmek gerekmektedir.  Bu yazımda SQL fonksiyonlarının Python kullanılarak nasıl yazılabileceğini göstereceğim. İstenen çıktıyı verecek birden fazla metot olabileceğini unutmadan yazıyı okumanızı tavsiye ederim.   Bu çalışma için dataseti  buradan indirebilirsiniz. Dataseti,python dosyanızın olduğu dizine "loan_train" adıyla yükleyin. Birçok fonksiyon olduğu için yazıyı partlara ayırdım. Diğer partlara yazının sonundaki yönlendirmelerle ulaşabilirsiniz. Part1 de SQL de data analiz aşamasında sıklıkla kullanılan aşağıdaki kodların Python'da nasıl yazılacağını öğreneceğiz. Basitten zora doğru gideceğiz. İncelemek istediğiniz koda tıklayarak kodun yazımına doğrudan ilerleyebilirsiniz. İlerlediğiniz sayfadan tekrar buraya dönmek için kural adına tıklamanız yeterlidir. SELECT   *   FROM   X SELECT  A,B,C   FROM   X SELECT...