ນີ້ແມ່ນ 6 ຂັ້ນຕອນການຈັດປະເພດເພື່ອຄາດຄະເນອັດຕາການຕາຍດ້ວຍຫົວໃຈລົ້ມເຫຼວ; Random Forest, Logistic Regression, KNN, Decision Tree, SVM, ແລະ Naive Bayes ເພື່ອຊອກຫາ Algorithm ທີ່ດີທີ່ສຸດ.

ອອກແບບໃນ CanvaPro

ໃນບົດຂຽນ blog ນີ້, ຂ້ອຍຈະໃຊ້ 6 ຂັ້ນຕອນການຈັດປະເພດທີ່ແຕກຕ່າງກັນເພື່ອຄາດຄະເນອັດຕາການຕາຍດ້ວຍຫົວໃຈລົ້ມເຫຼວ.

ເພື່ອເຮັດສິ່ງນີ້, ພວກເຮົາຈະນໍາໃຊ້ວິທີການຈັດປະເພດ.

ການຈັດປະເພດ- ອອກແບບໃນ Canva

ນີ້ແມ່ນ algorithms ທີ່ຂ້ອຍຈະໃຊ້;

  • ປ່າສຸ່ມ
  • Logistic Regression
  • KNN
  • ຕົ້ນໄມ້ການຕັດສິນໃຈ
  • svm
  • Naive Bayes

ແລະ ຫຼັງ​ຈາກ​ນັ້ນ, ຂ້າ​ພະ​ເຈົ້າ​ຈະ​ສົມ​ທຽບ​ຜົນ​ໄດ້​ຮັບ​ຕາມ​ນັ້ນ​;

  • ຄວາມຖືກຕ້ອງ
  • ຄວາມຊັດເຈນ
  • ຈື່
  • ຄະແນນ F1.

ມັນຈະຍາວກວ່າການຕອບ blog ອື່ນໆຂອງຂ້ອຍ, ແຕ່ຫຼັງຈາກອ່ານບົດຄວາມນີ້, ທ່ານອາດຈະມີຄວາມຮູ້ອັນໃຫຍ່ຫຼວງກ່ຽວກັບວິທີການຈັດປະເພດຂອງເຄື່ອງຈັກແລະ metrics ການປະເມີນຜົນ.

ຖ້າທ່ານຕ້ອງການຮູ້ເພີ່ມເຕີມກ່ຽວກັບເງື່ອນໄຂການຮຽນຮູ້ເຄື່ອງຈັກ, ນີ້ແມ່ນບົດຄວາມ blog ຂອງຂ້ອຍ, Machine Learning AZ ອະທິບາຍສັ້ນໆ.

ຕອນນີ້ໃຫ້ເລີ່ມຕົ້ນດ້ວຍຂໍ້ມູນ.

Content Table
· Introduction
· Data Exploration
· Data Visualization
· Feature Selection
∘ PCA
∘ Correlation Graph
· Model Building
∘ Train- Test Split
· Model Evaluation Metrics
∘ Random Forest Classifier
∘ Logistic Regression
· KNN
∘ Decision Tree
∘ Support Vector Machine
∘ Naive Bayes
· Prediction Dictionary
∘ Most Accurate Model
∘ Model with Highest Precision
∘ Model with Highest Recall
∘ Model with Highest F1 Score
· Conclusion

ນີ້ແມ່ນຊຸດຂໍ້ມູນຈາກ UCI Machine Learning repository, ເຊິ່ງເປັນເວັບໄຊທ໌ເປີດແຫຼ່ງ, ທ່ານສາມາດເຂົ້າເຖິງຊຸດຂໍ້ມູນອື່ນໆຈໍານວນຫຼາຍ, ເຊິ່ງໄດ້ຖືກຈັດປະເພດໂດຍສະເພາະຕາມຫນ້າວຽກ (Regression, Classification), ປະເພດຄຸນລັກສະນະ (ປະເພດ, ຕົວເລກ), ແລະອື່ນໆ.

ຫຼື​ຖ້າ​ຫາກ​ວ່າ​ທ່ານ​ຕ້ອງ​ການ​ທີ່​ຈະ​ຊອກ​ຫາ​ບ່ອນ​ທີ່​ຈະ​ຊອກ​ຫາ​ຊັບ​ພະ​ຍາ​ກອນ​ຟຣີ​ເພື່ອ​ດາວ​ໂຫລດ​ຊຸດ​ຂໍ້​ມູນ​.

ໃນປັດຈຸບັນ, ຊຸດຂໍ້ມູນນີ້, ມີບັນທຶກທາງການແພດຂອງຄົນເຈັບ 299 ຄົນທີ່ມີຫົວໃຈລົ້ມເຫຼວແລະມີ 13 ລັກສະນະທາງດ້ານການຊ່ວຍ, ເຊິ່ງແມ່ນ;

ອາຍຸ(ປີ)

ພະຍາດເລືອດຈາງ: ການຫຼຸດລົງຂອງເມັດເລືອດແດງຫຼື hemoglobin (boolean)

ຄວາມ​ດັນ​ເລືອດ​ສູງ: ຖ້າຄົນເຈັບມີ hypertension (boolean)

Creatinine phosphokinase (CPK): ລະດັບຂອງເອນໄຊ CPK ໃນເລືອດ (mcg/L)

ພະຍາດເບົາຫວານ: ຖ້າຄົນເຈັບເປັນພະຍາດເບົາຫວານ (ບູລີນ)

ເສດສ່ວນທີ່ຖອດອອກເປີເຊັນຂອງເລືອດອອກຈາກຫົວໃຈໃນແຕ່ລະການຫົດຕົວ (ເປີເຊັນ)

ເມັດເລືອດ: ເມັດເລືອດໃນເລືອດ (kiloplatelets/mL)

ເພດ: ຜູ້ຍິງ ຫຼືຜູ້ຊາຍ (ຄູ່)

Serum creatinine: ລະດັບ creatinine ໃນເລືອດ (mg/dL)

ເຊລັມໂຊດຽມ: ລະດັບຂອງ serum sodium ໃນເລືອດ (mEq/L)

ສູບຢາ: ຖ້າຄົນເຈັບສູບຢາຫຼືບໍ່ (ບູລີນ)

ເວລາ: ໄລຍະເວລາຕິດຕາມ (ມື້)

[target] ເຫດການເສຍຊີວິດ: ຖ້າຄົນເຈັບເສຍຊີວິດໃນລະຫວ່າງໄລຍະເວລາຕິດຕາມ (boolean)

ຫຼັງຈາກໂຫຼດຂໍ້ມູນແລ້ວ, ໃຫ້ເບິ່ງຂໍ້ມູນກ່ອນ.

ຮູບພາບໂດຍຜູ້ຂຽນ

ເພື່ອນໍາໃຊ້ລະບົບການຮຽນຮູ້ເຄື່ອງຈັກ, ທ່ານຕ້ອງແນ່ໃຈວ່າປະເພດຂອງຂໍ້ມູນ, ແລະກວດເບິ່ງວ່າຄໍລໍາມີຄ່າທີ່ບໍ່ແມ່ນ null ຫຼືບໍ່.

ຮູບພາບໂດຍຜູ້ຂຽນ

ບາງຄັ້ງ, ຊຸດຂໍ້ມູນຂອງພວກເຮົາສາມາດຈັດຮຽງພ້ອມກັບຖັນສະເພາະຫນຶ່ງ. ນັ້ນແມ່ນເຫດຜົນທີ່ຂ້ອຍຈະໃຊ້ວິທີການຕົວຢ່າງເພື່ອຊອກຫາ.

ໂດຍວິທີທາງການ, ຖ້າທ່ານຕ້ອງການເບິ່ງລະຫັດແຫຼ່ງຂອງໂຄງການນີ້, ຈອງກັບຂ້ອຍທີ່ນີ້ແລະຂ້ອຍຈະສົ່ງ PDF ທີ່ມີລະຫັດທີ່ມີຄໍາອະທິບາຍ.

ຕອນນີ້, ໃຫ້ສືບຕໍ່. ນີ້ແມ່ນ 5 ແຖວຕົວຢ່າງແບບສຸ່ມຈາກຊຸດຂໍ້ມູນ. ຢ່າຈື່, ຖ້າທ່ານແລ່ນລະຫັດ, ແຖວຈະແຕກຕ່າງກັນຫມົດເພາະວ່າຫນ້າທີ່ເຫຼົ່ານີ້ສົ່ງຄືນແຖວແບບສຸ່ມ.

ຮູບພາບໂດຍຜູ້ຂຽນ.

ບັດນີ້ເຮົາມາເບິ່ງຄ່ານັບຈາກຄວາມດັນເລືອດສູງ. ຂ້ອຍຮູ້, ວິທີການຈໍານວນຫຼາຍຈະມີຢູ່ສໍາລັບຄໍລໍານີ້ (2) ແຕ່ການກວດສອບເຮັດໃຫ້ຂ້ອຍຮູ້ສຶກມີຄວາມສາມາດກ່ຽວກັບຂໍ້ມູນ.

ຮູບພາບໂດຍຜູ້ຂຽນ

ແມ່ນແລ້ວ, ເບິ່ງຄືວ່າ, ພວກເຮົາມີຄົນເຈັບ 105 ຄົນທີ່ມີຄວາມດັນເລືອດສູງແລະ 194 ຄົນທີ່ບໍ່ມີພະຍາດ.

ຂໍໃຫ້ເບິ່ງການນັບມູນຄ່າການສູບຢາ.

ຮູບພາບໂດຍຜູ້ຂຽນ

ຂ້າພະເຈົ້າຄິດວ່າມັນພຽງພໍກັບການຂຸດຄົ້ນຂໍ້ມູນ.

ໃຫ້ພວກເຮົາສ້າງຮູບພາບຂໍ້ມູນເລັກນ້ອຍ.

ແນ່ນອນ, ສ່ວນນີ້ສາມາດຂະຫຍາຍໄດ້ເນື່ອງຈາກຄວາມຕ້ອງການຂອງໂຄງການຂອງທ່ານ.

ນີ້ແມ່ນບົດຄວາມ blog, ເຊິ່ງປະກອບດ້ວຍຕົວຢ່າງຂອງການວິເຄາະຂໍ້ມູນກັບ python, ໂດຍສະເພາະແມ່ນການນໍາໃຊ້ຫ້ອງສະຫມຸດ pandas.

ຖ້າ​ຫາກ​ວ່າ​ທ່ານ​ຕ້ອງ​ການ​ກວດ​ສອບ​ການ​ແຜ່​ກະ​ຈາຍ​ຂອງ​ຄຸນ​ນະ​ສົມ​ບັດ​, ເພື່ອ​ລົບ​ລ້າງ​ໃຫ້​ເຂົາ​ເຈົ້າ​ຫຼື​ເຮັດ​ການ​ກວດ​ພົບ outlier​.

ຮູບພາບໂດຍຜູ້ຂຽນ- ກຣາຟການແຜ່ກະຈາຍ

ແນ່ນອນ, ເສັ້ນສະແດງນີ້ແມ່ນພຽງແຕ່ໃຫ້ຂໍ້ມູນ. ຖ້າທ່ານຕ້ອງການເບິ່ງໃກ້ຊິດເພື່ອກວດພົບ outliers, ທ່ານຕ້ອງແຕ້ມເສັ້ນສະແດງແຕ່ລະອັນ.

ຮູບພາບໂດຍຜູ້ຂຽນ

ໃນປັດຈຸບັນ, ໃຫ້ພວກເຮົາເຂົ້າໄປໃນພາກສ່ວນການຄັດເລືອກຄຸນນະສົມບັດ.

ໂດຍວິທີທາງການ, Matplotlib ແລະ seaborn ແມ່ນກອບການເບິ່ງເຫັນຂໍ້ມູນທີ່ມີປະສິດທິພາບສູງ. ຖ້າທ່ານຕ້ອງການຮູ້ເພີ່ມເຕີມກ່ຽວກັບພວກມັນ, ນີ້ແມ່ນບົດຄວາມຂອງຂ້ອຍ, ກ່ຽວກັບ Data Visualization ສໍາລັບການຮຽນຮູ້ເຄື່ອງຈັກກັບ Python.

PCA

ໂອເຄ, ຢ່າເລືອກຄຸນສົມບັດຂອງພວກເຮົາ.

ໂດຍການເຮັດ PCA, ຕົວຈິງແລ້ວພວກເຮົາສາມາດຊອກຫາການນັບຄຸນນະສົມບັດ n ເພື່ອອະທິບາຍອັດຕາສ່ວນ x ຂອງກອບຂໍ້ມູນ.

ນີ້, ເບິ່ງຄືວ່າ, ປະມານ 8 ລັກສະນະຈະພຽງພໍສໍາລັບພວກເຮົາທີ່ຈະອະທິບາຍ 80% ຂອງຊຸດຂໍ້ມູນ.

PCA-ຮູບພາບໂດຍຜູ້ຂຽນ

Correlation Graph

ລັກສະນະທີ່ກ່ຽວຂ້ອງ, ຈະທໍາລາຍການປະຕິບັດຂອງຕົວແບບຂອງພວກເຮົາ, ດັ່ງນັ້ນຫຼັງຈາກເຮັດ PCA, ໃຫ້ພວກເຮົາແຕ້ມແຜນທີ່ທີ່ກ່ຽວຂ້ອງເພື່ອລົບລ້າງລັກສະນະທີ່ກ່ຽວຂ້ອງ.

ແຜນທີ່ຄວາມສຳພັນ – ຮູບພາບໂດຍຜູ້ຂຽນ

ທີ່ນີ້, ທ່ານສາມາດເບິ່ງການຮ່ວມເພດແລະການສູບຢາເບິ່ງມີຄວາມກ່ຽວຂ້ອງສູງ.

ຈຸດປະສົງຕົ້ນຕໍຂອງບົດຄວາມນີ້ແມ່ນເພື່ອປຽບທຽບຜົນໄດ້ຮັບຂອງລະບົບການຈັດປະເພດ, ນັ້ນແມ່ນເຫດຜົນທີ່ຂ້ອຍຈະບໍ່ລົບລ້າງທັງສອງ, ແຕ່ເຈົ້າສາມາດຢູ່ໃນຕົວແບບຂອງເຈົ້າ.

ໃນປັດຈຸບັນມັນແມ່ນເວລາທີ່ຈະສ້າງຮູບແບບການຮຽນຮູ້ເຄື່ອງຈັກຂອງທ່ານ. ເພື່ອເຮັດສິ່ງນີ້, ກ່ອນອື່ນ ໝົດ, ພວກເຮົາຕ້ອງແບ່ງປັນຂໍ້ມູນ.

ແຍກການທົດສອບລົດໄຟ

ການປະເມີນປະສິດທິພາບຂອງຕົວແບບຂອງທ່ານກ່ຽວກັບຂໍ້ມູນທີ່ຕົວແບບບໍ່ຮູ້ແມ່ນສ່ວນສໍາຄັນຂອງຮູບແບບການຮຽນຮູ້ເຄື່ອງຈັກ. ເພື່ອເຮັດສິ່ງນີ້, ໂດຍທົ່ວໄປແລ້ວ, ພວກເຮົາແບ່ງຂໍ້ມູນ 80/20.

ແຕ່ເຕັກນິກອື່ນແມ່ນໃຊ້ເພື່ອປະເມີນຮູບແບບການຮຽນຮູ້ຂອງເຄື່ອງຈັກ, ເຊິ່ງແມ່ນການກວດສອບຂ້າມ. ການກວດສອບຂ້າມແມ່ນໃຊ້ເພື່ອເລືອກຮູບແບບການຮຽນຮູ້ເຄື່ອງຈັກທີ່ດີທີ່ສຸດໃນບັນດາທາງເລືອກຂອງທ່ານ. ບາງຄັ້ງມັນຖືກເອີ້ນວ່າ dev-set, ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມທ່ານສາມາດຄົ້ນຫາວິດີໂອຂອງ Andrew NG, ທີ່ມີຂໍ້ມູນສູງ.

ຕອນນີ້ໃຫ້ພວກເຮົາເຂົ້າໄປໃນຕົວຊີ້ວັດການປະເມີນຜົນແບບຈໍາລອງ.

ດຽວນີ້, ໃຫ້ຊອກຫາຕົວຊີ້ວັດການປະເມີນຮູບແບບການຈັດປະເພດ.

ຄວາມຊັດເຈນ

ຖ້າທ່ານຄາດຄະເນທາງບວກ, ອັດຕາສ່ວນຂອງການຕັດສິນໃຈທີ່ຖືກຕ້ອງແມ່ນຫຍັງ?

ຈື່

ອັດ​ຕາ​ທາງ​ບວກ​ທີ່​ແທ້​ຈິງ​ຕໍ່​ກັບ​ທັງ​ຫມົດ​ໃນ​ທາງ​ບວກ​.

ຄະແນນ F1

ຄວາມກົມກຽວກັນຫມາຍເຖິງການເອີ້ນຄືນແລະຄວາມແມ່ນຍໍາ

ສໍາລັບເພີ່ມເຕີມກ່ຽວກັບການຈັດປະເພດ, ນີ້ແມ່ນການຕອບຂອງຂ້ອຍ: ການຈັດປະເພດ AZ ອະທິບາຍສັ້ນໆ.

ນີ້ແມ່ນສູດຄວາມແມ່ນຍໍາ, ການເອີ້ນຄືນ, ແລະຄະແນນ f1.

ສູດຄວາມຊັດເຈນ – ຮູບພາບໂດຍຜູ້ຂຽນ
Recall Formula- ຮູບພາບໂດຍຜູ້ຂຽນ
ສູດຄະແນນ F1- ຮູບພາບໂດຍຜູ້ຂຽນ

ການຈັດປະເພດປ່າໄມ້ແບບສຸ່ມ

ຂັ້ນຕອນການຈັດປະເພດທຳອິດຂອງພວກເຮົາແມ່ນປ່າສຸ່ມ.

ຫຼັງ​ຈາກ​ການ​ນໍາ​ໃຊ້​ວິ​ທີ​ການ​ນີ້​, ນີ້​ແມ່ນ​ຜົນ​ໄດ້​ຮັບ​.

ຖ້າທ່ານຕ້ອງການເບິ່ງລະຫັດແຫຼ່ງ, ກະລຸນາຈອງຂ້ອຍທີ່ນີ້ໂດຍບໍ່ເສຍຄ່າ.

ຂ້າ​ພະ​ເຈົ້າ​ຈະ​ສົ່ງ PDF ກັບ​ທ່ານ, ເຊິ່ງ​ປະ​ກອບ​ມີ​ລະ​ຫັດ​ທີ່​ມີ​ຄໍາ​ອະ​ທິ​ບາຍ.

ຄະແນນການປະເມີນປ່າໄມ້ແບບສຸ່ມ – ຮູບພາບໂດຍຜູ້ຂຽນ

ຕອນນີ້, ໃຫ້ສືບຕໍ່.

Logistic Regression

ນີ້ແມ່ນຕົວຢ່າງຂອງການຈັດປະເພດອື່ນ.

Logistic regression ໃຊ້ຟັງຊັນ sigmoid ເພື່ອເຮັດການຈັດປະເພດຄູ່.

ຮູບພາບໂດຍຜູ້ຂຽນ – ຟັງຊັນ Sigmoid
Logistic Regression Prediction Scores – ຮູບພາບໂດຍຜູ້ຂຽນ

ຄວາມຖືກຕ້ອງແລະຄວາມແມ່ນຍໍາຂອງນີ້ເບິ່ງສູງກວ່າ.

ໃຫ້ສືບຕໍ່ຊອກຫາຕົວແບບທີ່ດີທີ່ສຸດ.

KNN- ອອກແບບໃນ Canva

ໂອເຄ, ຕອນນີ້ໃຫ້ໃຊ້ເຄທີ່ໃກ້ທີ່ສຸດ ແລະເບິ່ງຜົນໄດ້ຮັບ.

ແຕ່ເມື່ອສະຫມັກ Knn, ທ່ານຕ້ອງເລືອກ “K”, ເຊິ່ງເປັນຕົວເລກຂອງເພື່ອນບ້ານທີ່ທ່ານຈະເລືອກ.

ເພື່ອເຮັດສິ່ງນີ້, ການນໍາໃຊ້ loop ເບິ່ງຄືວ່າເປັນວິທີທີ່ດີທີ່ສຸດ.

ຊອກຫາຄະແນນທີ່ດີທີ່ສຸດ – ຮູບພາບໂດຍຜູ້ຂຽນ

ໃນປັດຈຸບັນ, ເບິ່ງຄືວ່າ 2 ມີຄວາມຖືກຕ້ອງທີ່ດີທີ່ສຸດ, ແຕ່ການກໍາຈັດການແຊກແຊງຂອງມະນຸດ, ໃຫ້ຊອກຫາຮູບແບບທີ່ດີທີ່ສຸດໂດຍໃຊ້ລະຫັດ.

ຄະແນນ K ທີ່ດີທີ່ສຸດ- ຮູບພາບໂດຍຜູ້ຂຽນ

ຫຼັງຈາກເລືອກ k=2, ນີ້ແມ່ນຄວາມຖືກຕ້ອງ. ເບິ່ງຄືວ່າ K-NN ເຮັດວຽກບໍ່ດີ. ແຕ່ບາງທີພວກເຮົາຕ້ອງລົບລ້າງລັກສະນະທີ່ກ່ຽວຂ້ອງຂອງການປົກກະຕິ, ແນ່ນອນ, ການດໍາເນີນງານເຫຼົ່ານີ້ສາມາດແຕກຕ່າງກັນ.

ຄະແນນການປະເມີນຜົນ KNN- ຮູບພາບໂດຍຜູ້ຂຽນ

ດີເລີດ, ໃຫ້ສືບຕໍ່.

ຕົ້ນໄມ້ການຕັດສິນໃຈ

ໃນປັດຈຸບັນມັນເປັນເວລາທີ່ຈະນໍາໃຊ້ຕົ້ນໄມ້ການຕັດສິນໃຈ. ແຕ່ພວກເຮົາຕ້ອງຊອກຫາຄະແນນຄວາມເລິກທີ່ດີທີ່ສຸດເພື່ອເຮັດແນວນັ້ນ.

ດັ່ງນັ້ນເມື່ອນໍາໃຊ້ຕົວແບບຂອງພວກເຮົາ, ມັນເປັນສິ່ງສໍາຄັນທີ່ຈະທົດສອບຄວາມເລິກທີ່ແຕກຕ່າງກັນ.

ຊອກຫາຄວາມເລິກທີ່ດີທີ່ສຸດສໍາລັບຄວາມຖືກຕ້ອງ – ຮູບພາບໂດຍຜູ້ຂຽນ

ແລະເພື່ອຊອກຫາຄວາມເລິກທີ່ດີທີ່ສຸດໃນບັນດາຜົນໄດ້ຮັບ, ໃຫ້ພວກເຮົາສືບຕໍ່ອັດຕະໂນມັດ.

ຄວາມເລິກສໍາລັບຄວາມຖືກຕ້ອງທີ່ດີທີ່ສຸດ – ຮູບພາບໂດຍຜູ້ຂຽນ

ຕົກລົງ, ຕອນນີ້ພວກເຮົາຊອກຫາຄວາມເລິກປະສິດທິພາບທີ່ດີທີ່ສຸດ. ໃຫ້ຊອກຫາຄວາມຖືກຕ້ອງ.

ຄະແນນການປະເມີນຕົ້ນໄມ້ການຕັດສິນໃຈ – ຮູບພາບໂດຍຜູ້ຂຽນ

ດີເລີດ, ໃຫ້ສືບຕໍ່.

ສະຫນັບສະຫນູນ Vector Machine

SVM- ອອກແບບໃນ Canva

ໃນປັດຈຸບັນເພື່ອນໍາໃຊ້ SVM algorithm, ພວກເຮົາຕ້ອງເລືອກປະເພດ kernel. ປະເພດ kernel ນີ້ຈະສົ່ງຜົນກະທົບຕໍ່ຜົນໄດ້ຮັບຂອງພວກເຮົາ, ດັ່ງນັ້ນພວກເຮົາຈະເຮັດຊ້ໍາເພື່ອຊອກຫາປະເພດເມັດ, ເຊິ່ງສົ່ງຄືນຮູບແບບຄະແນນ f1 ທີ່ດີທີ່ສຸດ.

ຊອກຫາປະເພດ kernel ທີ່ຖືກຕ້ອງທີ່ສຸດ – ຮູບພາບໂດຍຜູ້ຂຽນ

Okey, ພວກເຮົາຈະໃຊ້ kernel linear.

ໃຫ້ຊອກຫາຄວາມຖືກຕ້ອງ, ຄວາມແມ່ນຍໍາ, ການເອີ້ນຄືນ, ແລະ f1_score ດ້ວຍ kernel ເສັ້ນ.

ຄະແນນການປະເມີນຜົນ SVM – ຮູບພາບໂດຍຜູ້ຂຽນ

Naive Bayes

Naive Bayes- ອອກແບບໃນ Canva

ໃນປັດຈຸບັນ, Naive Bayes ຈະເປັນຕົວແບບສຸດທ້າຍຂອງພວກເຮົາ.

ເຈົ້າຮູ້ບໍວ່າເປັນຫຍັງ Bayes naive ຖືກເອີ້ນວ່າ naive?

ເນື່ອງຈາກວ່າ algorithm ສົມມຸດວ່າແຕ່ລະຕົວແປການປ້ອນຂໍ້ມູນແມ່ນເອກະລາດ. ແນ່ນອນ, ການສົມມຸດຕິຖານນີ້ແມ່ນເປັນໄປບໍ່ໄດ້ເມື່ອນໍາໃຊ້ຂໍ້ມູນຊີວິດຈິງ. ທີ່ເຮັດໃຫ້ algorithm ຂອງພວກເຮົາ “naive.”

ຕົກລົງ, ໃຫ້ສືບຕໍ່.

ຄະແນນການປະເມີນຜົນ Naive Bayes – ຮູບພາບໂດຍຜູ້ຂຽນ.

ໃນປັດຈຸບັນຫຼັງຈາກສໍາເລັດການຄົ້ນຫາແບບຈໍາລອງ. ໃຫ້ບັນທຶກຜົນໄດ້ຮັບທັງຫມົດເຂົ້າໄປໃນກອບຂໍ້ມູນຫນຶ່ງ, ເຊິ່ງຈະໃຫ້ພວກເຮົາມີໂອກາດທີ່ຈະປະເມີນຮ່ວມກັນ.

ຫຼັງຈາກນັ້ນ, ໃນປັດຈຸບັນໃຫ້ພວກເຮົາຊອກຫາຮູບແບບທີ່ຖືກຕ້ອງທີ່ສຸດ.

ຮູບແບບທີ່ຖືກຕ້ອງທີ່ສຸດ

ຮູບແບບທີ່ຖືກຕ້ອງທີ່ສຸດ – ຮູບພາບໂດຍຜູ້ຂຽນ

ຮູບແບບທີ່ມີຄວາມແມ່ນຍໍາສູງສຸດ

ຕົວແບບທີ່ມີຄວາມຊັດເຈນສູງສຸດ – ຮູບພາບໂດຍຜູ້ຂຽນ

ຕົວແບບທີ່ມີການເອີ້ນຄືນສູງສຸດ

ຕົວແບບທີ່ມີການເອີ້ນຄືນສູງສຸດ – ຮູບພາບໂດຍຜູ້ຂຽນ

ຕົວແບບທີ່ມີຄະແນນ F1 ສູງສຸດ

ຕົວແບບທີ່ມີຄະແນນ F1 ສູງສຸດ – ຮູບພາບໂດຍຜູ້ຂຽນ

ໃນປັດຈຸບັນ, metric ຈຸດປະສົງອາດຈະແຕກຕ່າງກັນໄປຕາມຄວາມຕ້ອງການຂອງໂຄງການຂອງທ່ານ. ທ່ານອາດຈະຊອກຫາຕົວແບບທີ່ຖືກຕ້ອງທີ່ສຸດ, ຫຼືແບບຈໍາລອງທີ່ມີການເອີ້ນຄືນສູງສຸດ.

ນີ້ແມ່ນວິທີການ, ທ່ານສາມາດຊອກຫາຮູບແບບທີ່ດີທີ່ສຸດ, ເຊິ່ງຈະໃຫ້ບໍລິການຄວາມຕ້ອງການຂອງໂຄງການຂອງທ່ານ.

ຖ້າທ່ານຕ້ອງການໃຫ້ຂ້ອຍສົ່ງລະຫັດແຫຼ່ງ PDF ທີ່ມີຄໍາອະທິບາຍໂດຍບໍ່ເສຍຄ່າ, ກະລຸນາຈອງຂ້ອຍທີ່ນີ້.

Categories: AiHome

0 Comments

Leave a Reply

Avatar placeholder

Your email address will not be published. Required fields are marked *