Merhabalar,
Bu yazı, PYTHON İÇİN SQL FONKSİYONLARI - PART1 yazısının devamıdır. Bu yazımda değineceğim analiz fonksiyonları aşağıdaki gibidir. Bu çalışma için dataseti buradan indirebilirsiniz .İncelemek istediğiniz koda tıklayarak kodun yazımına doğrudan ilerleyebilirsiniz. İlerlediğiniz sayfadan tekrar buraya dönmek için kural adına tıklamanız yeterlidir.
16. SELECT * FROM X WHERE .... IS NOT NULL
17.SELECT * FROM X WHERE A BETWEEN .... AND ...
18.SELECT DISTINCT A FROM X
19.SELECT DISTINCT A,B FROM X
23.SELECT A,FONKSİYON() FROM X WHERE .... GROUP BY A
Part1'i okuyup buraya geldiyseniz tekrar olacak ama istediğiniz bir çıktıyı verecek birden fazla yöntem olduğunu aklınızdan çıkarmadan okumanızı tavsiye ederim.
loan_data[loan_data.Credit_History.notnull()] #1.yol
loan_data[~loan_data.Credit_History.isna()] #2.yol
loan_data[loan_data.ApplicantIncome.between(3000,5000)]
loan_data.Property_Area.unique()
loan_data[["Gender","Education"]].drop_duplicates()
loan_data[["Gender","Education"]][loan_data.ApplicantIncome>3500].drop_duplicates()
loan_data["oto_onay"]=np.where((loan_data.ApplicantIncome>4000) &(loan_data.LoanAmount<1000),1,0) #1.yol
#2.yol loan_data.loc[(loan_data.ApplicantIncome>4000) &(loan_data.LoanAmount<1000),"oto_onay2"]=1 loan_data.loc[~(loan_data.ApplicantIncome>4000),"oto_onay2"]=0 loan_data.loc[(loan_data.ApplicantIncome>4000) & (loan_data.LoanAmount.isna()),"oto_onay2"]=2
loan_data["list_comp_"]=[1 if (loan_data.loc[i,"ApplicantIncome"]>4000) and (loan_data.loc[i,"LoanAmount"]<1000) else 0 for i in range(loan_data.shape[0])] #3.yol
loan_data.groupby("Gender")["LoanAmount"].mean() #1.örnek
loan_data.groupby("Gender")["LoanAmount"].agg(["sum","min","max"]) #2.örnek
loan_data.groupby("Gender").agg({"LoanAmount":["sum","min","max"],"ApplicantIncome":"sum"}) #3.örnek
loan_data[loan_data["Married"]=="Yes"].groupby("Gender")["LoanAmount"].mean()
loan_data[loan_data["Married"]=="Yes"].groupby("Gender")["LoanAmount"].describe()
loan_data.groupby(["Gender","Education"])["ApplicantIncome"].mean()
loan_data[loan_data.Credit_History==1].groupby(["Gender_Missing","Education"])["ApplicantIncome"].mean()
loan_data.assign(result=np.where(loan_data.Credit_History==1,1,0)).groupby("Property_Area")["result"].sum()
loan_data.assign(result=np.where(loan_data.Credit_History==1,loan_data.LoanAmount,0)).groupby("Property_Area")["result"].max()
loan_data.assign(result=np.where(loan_data.Credit_History==1,loan_data.LoanAmount,0)).groupby("Property_Area")["result"].min()
28., 29. ve 30. maddelerdeki join işlemini yapabilmek için loan_data2 dataframe'ini oluşturuyoruz.
loan_data2=loan_data.loc[:100,:] loan_data2.rename(columns={"Loan_ID":"Loan_ID2"},inplace=True) pd.merge(loan_data,loan_data2,how="inner",left_on="Loan_ID",right_on="Loan_ID2")
pd.merge(loan_data,loan_data2,how="left",left_on="Loan_ID",right_on="Loan_ID2")
pd.merge(loan_data,loan_data2,how="right",left_on="Loan_ID",right_on="Loan_ID2")
Bir yazımın daha sonuna geldiniz. Bu yazının diğer partlarına ulaşmak için;
PYTHON İÇİN SQL FONKSİYONLARI - PART1 için tıklayınız.
PYTHON İÇİN SQL FONKSİYONLARI - PART3 için tıklayınız .
Yorumlar
Yorum Gönder