ການມາຮອດຂອງປັນຍາປະດິດ (AI) ໃນຄອມພິວເຕີ້ຝັງໄດ້ນໍາໄປສູ່ການແຜ່ຂະຫຍາຍຂອງການແກ້ໄຂທີ່ມີທ່າແຮງທີ່ມີຈຸດປະສົງເພື່ອສະຫນອງປະສິດທິພາບສູງທີ່ຈໍາເປັນເພື່ອປະຕິບັດການປຽບທຽບເຄືອຂ່າຍ neural ກ່ຽວກັບການຖ່າຍທອດວິດີໂອໃນອັດຕາທີ່ສູງ. ເຖິງແມ່ນວ່າຫຼາຍ benchmarks ເຊັ່ນ: ສິ່ງທ້າທາຍ ImageNet ເຮັດວຽກຢູ່ໃນຄວາມລະອຽດຕ່ໍາເມື່ອປຽບທຽບແລະດັ່ງນັ້ນຈຶ່ງສາມາດໄດ້ຮັບການຈັດການກັບການແກ້ໄຂ AI ຝັງຕົວຈໍານວນຫຼາຍ, ຄໍາຮ້ອງສະຫມັກໃນໂລກທີ່ແທ້ຈິງໃນຮ້ານຂາຍຍ່ອຍ, ຢາ, ຄວາມປອດໄພ, ແລະການຄວບຄຸມອຸດສາຫະກໍາຮຽກຮ້ອງໃຫ້ມີຄວາມສາມາດໃນການຈັດການກັບກອບວິດີໂອແລະຮູບພາບທີ່. ຄວາມລະອຽດສູງສຸດ 4kp60 ແລະຫຼາຍກວ່ານັ້ນ.

ຄວາມສາມາດໃນການຂະຫຍາຍໃຫຍ່ຂື້ນແມ່ນສໍາຄັນແລະບໍ່ສະເຫມີເປັນທາງເລືອກທີ່ມີລະບົບເທິງຊິບ (SoC) ເວທີທີ່ສະຫນອງການປະສົມປະສານຄົງທີ່ຂອງໂປເຊດເຊີເຈົ້າພາບແລະເຄື່ອງເລັ່ງ neural. ເຖິງແມ່ນວ່າພວກເຂົາມັກຈະສະຫນອງວິທີການປະເມີນຜົນການປະຕິບັດຂອງຮູບແບບທີ່ແຕກຕ່າງກັນຂອງເຄືອຂ່າຍ neural ໃນລະຫວ່າງການ prototyping, ການປະຕິບັດທັງຫມົດໃນຫນຶ່ງດັ່ງກ່າວຂາດ granularity ແລະ scalability ທີ່ລະບົບທີ່ແທ້ຈິງມັກຈະຕ້ອງການ. ໃນກໍລະນີນີ້, ຄໍາຮ້ອງສະຫມັກ AI ຊັ້ນອຸດສາຫະກໍາໄດ້ຮັບຜົນປະໂຫຍດຈາກສະຖາປັດຕະຍະກໍາທີ່ສົມດູນກັນຫຼາຍທີ່ປະສົມປະສານຂອງໂປເຊດເຊີ heterogeneous (ເຊັ່ນ, CPUs, GPUs) ແລະເຄື່ອງເລັ່ງຮ່ວມມືໃນທໍ່ປະສົມປະສານເພື່ອບໍ່ພຽງແຕ່ປະຕິບັດການປຽບທຽບກັບກອບວິດີໂອດິບແຕ່ໃຊ້ປະໂຫຍດຈາກທາງສ່ວນຫນ້າຂອງ. ແລະຫຼັງການປະມວນຜົນເພື່ອປັບປຸງຜົນໄດ້ຮັບໂດຍລວມຫຼືຈັດການການແປງຮູບແບບເພື່ອໃຫ້ສາມາດຈັດການກັບກ້ອງຖ່າຍຮູບແລະເຊັນເຊີຫຼາຍປະເພດ.

ສະຖານະການນຳໃຊ້ທົ່ວໄປແມ່ນຢູ່ໃນກ້ອງອັດສະລິຍະ ແລະເຄື່ອງໃຊ້ AI edge. ສໍາລັບອະດີດ, ຄວາມຕ້ອງການແມ່ນສໍາລັບການປະມວນຜົນວິໄສທັດແລະສະຫນັບສະຫນູນສໍາລັບການ inferencing neural-ເຄືອຂ່າຍທີ່ຈະປະສົມປະສານເຂົ້າໄປໃນກະດານກ້ອງຖ່າຍຮູບຕົ້ນຕໍ. ກ້ອງຖ່າຍຮູບອາດຈະຕ້ອງປະຕິບັດວຽກງານຕ່າງໆເຊັ່ນການນັບຈໍານວນຄົນຢູ່ໃນຫ້ອງແລະສາມາດຫຼີກເວັ້ນການນັບສອງຄັ້ງຖ້າຫົວຂໍ້ເຄື່ອນເຂົ້າແລະອອກຈາກມຸມເບິ່ງ. ບໍ່ພຽງແຕ່ກ້ອງອັດສະລິຍະສາມາດຮັບຮູ້ຄົນໄດ້ເທົ່ານັ້ນ, ແຕ່ຍັງສາມາດຈຳແນກພວກມັນຄືນໃໝ່ໄດ້ໂດຍອີງໃສ່ຂໍ້ມູນທີ່ກ້ອງໄດ້ປະມວນຜົນແລ້ວເພື່ອບໍ່ໃຫ້ມັນນັບສອງເທົ່າ. ນີ້ຮຽກຮ້ອງໃຫ້ມີການປະມວນຜົນຮູບພາບທີ່ຍືດຫຍຸ່ນແລະທໍ່ inferencing ບ່ອນທີ່ແອັບພລິເຄຊັນສາມາດຈັດການກັບການຮັບຮູ້ວັດຖຸພື້ນຖານເຊັ່ນດຽວກັນກັບວຽກງານທີ່ອີງໃສ່ inferencing ທີ່ຊັບຊ້ອນເຊັ່ນ: ການກໍານົດຄືນໃຫມ່.

ການສ້າງກ້ອງຖ່າຍຮູບອັດສະລິຍະ ແລະເຄື່ອງໃຊ້ AI ຂອບ

ໂດຍປົກກະຕິ, ໃນການອອກແບບກ້ອງຖ່າຍຮູບອັດສະລິຍະ, ໂປເຊດເຊີໂຮດຈະເອົາວັດສະດຸປ້ອນເຊັນເຊີທີ່ປ່ຽນເປັນຮູບແບບທີ່ເຫມາະສົມສໍາລັບການອະນຸມານ: ປັບຂະຫນາດ, ການຕັດ, ແລະການເຮັດໃຫ້ຂໍ້ມູນກອບເປັນປົກກະຕິເປັນຮູບແບບທີ່ເຫມາະສົມສໍາລັບການ inferencing ສູງ. ກໍລະນີການນໍາໃຊ້ທີ່ຄ້າຍຄືກັນແຕ່ປະສົມປະສານຫຼາຍແມ່ນອຸປະກອນ AI ຂອບ. ອັນນີ້ໃຊ້ວັດສະດຸປ້ອນຈາກຫຼາຍເຊັນເຊີ ແລະກ້ອງຖ່າຍຮູບທີ່ມີເຄືອຂ່າຍ, ເຊິ່ງຕ້ອງການຄວາມສາມາດໃນການຈັດການການຖ່າຍທອດວິດີໂອທີ່ບີບອັດຫຼາຍຄັ້ງ (ຫຼືເຂົ້າລະຫັດ) ພ້ອມກັນ. ໃນສະຖານະການຫຼາຍກ້ອງຖ່າຍຮູບນີ້, ພະລັງງານການປະມວນຜົນຈະຕ້ອງສາມາດປັບຂະຫນາດເພື່ອຈັດການກັບຮູບແບບ, ພື້ນທີ່ສີ, ແລະການແປງອື່ນໆທີ່ຕ້ອງການເພື່ອດໍາເນີນການ inferencing ແລະຍັງສາມາດຈັດການ inferences ຂະຫນານຫຼາຍ.

ການໄຫຼຂອງຄໍາຮ້ອງສະຫມັກກ້ອງຖ່າຍຮູບອັດສະລິຍະ. (ພາບ: ກິນາຣາ)
Edge AI ເຄື່ອງໃຊ້ກາຟິກ
Edge AI appliance application flow. (ພາບ: ກິນາຣາ)

ເຖິງແມ່ນວ່າການປະຕິບັດທີ່ອີງໃສ່ SoC ຄົງຈະຈັດການກັບກໍລະນີການນໍາໃຊ້ສະເພາະ, ຄວາມຕ້ອງການສໍາລັບການຂະຫຍາຍໄດ້ຊີ້ໃຫ້ເຫັນເຖິງຄວາມສາມາດໃນການປັບເວທີໃຫ້ເຫມາະສົມກັບຄວາມຕ້ອງການແລະສ້າງການສະຫນັບສະຫນູນສໍາລັບການຂະຫຍາຍແລະການຍົກລະດັບຕາມຄວາມຕ້ອງການຂອງລູກຄ້າປ່ຽນແປງ. ສໍາລັບເຫດຜົນນີ້, ມັນເປັນສິ່ງສໍາຄັນທີ່ຈະມຸ່ງເນັ້ນໃສ່ແພລະຕະຟອມທີ່ມີຄວາມສາມາດງ່າຍໃນຂະຫນາດຄວາມສາມາດຂອງຮາດແວທີ່ບໍ່ຈໍາເປັນຕ້ອງມີການປ່ຽນແປງທີ່ສໍາຄັນຂອງລະຫັດທີ່ເກີດຈາກຄວາມຕ້ອງການທີ່ຈະລະບຸອຸປະກອນທີ່ນໍາໃຊ້ສະຖາປັດຕະຍະກໍາທີ່ແຕກຕ່າງກັນ. ຈໍານວນຫນ້ອຍທີ່ສາມາດຈ່າຍໄດ້ porting overhead ນີ້ຫມາຍຄວາມວ່າ.

ນັກພັດທະນາຫຼາຍຄົນໄດ້ຮັບຮອງເອົາແພລະຕະຟອມການປຸງແຕ່ງຝັງຕົວທີ່ຂາຍໂດຍຜູ້ຂາຍເຊັ່ນ NXP Semiconductors ແລະ Qualcomm ເນື່ອງຈາກປະສິດທິພາບ, ຄຸນສົມບັດ, ແລະທາງເລືອກລາຄາທີ່ຫລາກຫລາຍທີ່ພວກເຂົາສະເຫນີ. ສໍາລັບຕົວຢ່າງ, ໂປເຊດເຊີ NXP i.MX ຄໍາຮ້ອງສະຫມັກກວມເອົາລະດັບຄວາມກ້ວາງຂອງຄວາມຕ້ອງການປະສິດທິພາບ. ກົງກັນຂ້າມກັບແພລະຕະຟອມ SoC ຄົງທີ່, ຄອບຄົວໂປເຊດເຊີ NXP ໄດ້ຮັບຜົນປະໂຫຍດຈາກການສະຫນັບສະຫນູນໄລຍະຍາວຂອງຜູ້ຂາຍແລະການຮັບປະກັນການສະຫນອງທີ່ຈໍາເປັນໃນຕະຫຼາດຄອມພິວເຕີ້ຝັງຫຼາຍ. ອຸປະກອນເຊັ່ນ i.MX 8M ສະຫນອງພື້ນຖານທີ່ດີສໍາລັບຄວາມຕ້ອງການຂອງເຄື່ອງໃຊ້ edge-AI. ການເລັ່ງການຖອດລະຫັດວິດີໂອໃນຕົວຂອງມັນເຮັດໃຫ້ມັນສາມາດຮອງຮັບການບີບອັດສີ່ສາຍ 1080p ຢູ່ໃນໂປເຊດເຊີດຽວ. ຄວາມສາມາດໃນການດໍາເນີນການ inferencing ໃນສາຍນ້ໍາຫຼາຍຫຼືຈັດການຮູບແບບທີ່ຊັບຊ້ອນແມ່ນຮອງຮັບໂດຍການ coupling ໂຮງງານຜະລິດຄໍາຮ້ອງສະຫມັກ i.MX ນີ້ກັບ Kinara ຂອງ Ara-1 accelerators.

ຄວາມຕ້ອງການສໍາລັບການແລ່ນຫຼາຍແບບ

ແຕ່ລະຕົວເລັ່ງສາມາດດໍາເນີນການຫຼາຍຕົວແບບ AI ໃນແຕ່ລະກອບທີ່ມີເວລາປ່ຽນສູນແລະສູນການໂຫຼດຢູ່ໃນໂປເຊດເຊີເຈົ້າພາບ, ສະຫນອງຄວາມສາມາດໃນການປະຕິບັດວຽກງານທີ່ສັບສົນໃນເວລາຈິງ. ໃນທາງກົງກັນຂ້າມກັບບາງທໍ່ທີ່ສົມມຸດຕິຖານທີ່ອີງໃສ່ batching ຂອງຫຼາຍໆກອບເພື່ອເພີ່ມການສົ່ງຜ່ານສູງສຸດ, Ara-1 ຖືກປັບປຸງໃຫ້ເຫມາະສົມສໍາລັບຂະຫນາດ batch ຂອງ 1 ແລະສໍາລັບການຕອບສະຫນອງສູງສຸດ.

ນີ້ຫມາຍຄວາມວ່າບໍ່ຈໍາເປັນຕ້ອງມີການອອກແບບກ້ອງຖ່າຍຮູບອັດສະລິຍະເພື່ອອີງໃສ່ໂປເຊດເຊີໂຮດເພື່ອປະຕິບັດສູດການກໍານົດຄືນໃຫມ່ຖ້າຕົວເລັ່ງກໍາລັງດໍາເນີນການ inferencing ໃນກອບອື່ນຫຼືບາງສ່ວນຂອງຫນຶ່ງ. ທັງສອງສາມາດຖືກສົ່ງໄປຫາ Ara-1 ເພື່ອໃຊ້ປະໂຫຍດຈາກຄວາມໄວທີ່ສູງຂຶ້ນຂອງມັນ. ບ່ອນທີ່ຕ້ອງການປະສິດທິພາບຫຼາຍ, ເຊັ່ນໃນອຸປະກອນ Edge-AI ທີ່ຄໍາຮ້ອງສະຫມັກທີ່ແຕກຕ່າງກັນອາດຈະຮຽກຮ້ອງໃຫ້ມີການປະຕິບັດຫນ້າ inference, ຕົວເລັ່ງຫຼາຍສາມາດຖືກນໍາໃຊ້ໃນຂະຫນານ.

ລະດັບການຂະຫຍາຍທີ່ສູງຂຶ້ນສາມາດເປີດໃຊ້ງານໄດ້ໂດຍການສະໜັບສະໜູນບໍ່ພຽງແຕ່ການເຊື່ອມຊິບລົງໃນກ້ອງຖ່າຍຮູບອັດສະລິຍະ ຫຼື PCB ເຄື່ອງໃຊ້ແຕ່ການອັບເກຣດ plug-in. ສໍາລັບການເຊື່ອມໂຍງແບບຊິບລົງ, Ara-1 ສະຫນັບສະຫນູນມາດຕະຖານອຸດສາຫະກໍາແລະອິນເຕີເຟດ PCIe ແບນວິດສູງສໍາລັບການເຊື່ອມຕໍ່ທີ່ງ່າຍກັບໂຮດໂປເຊດເຊີທີ່ລວມເອົາການໂຕ້ຕອບ PCIe Gen 3. ເສັ້ນທາງການເຊື່ອມໂຍງທີສອງແມ່ນການໃຊ້ໂມດູນທີ່ສາມາດສຽບໂດຍກົງໃສ່ກະດານຫຼັກທີ່ສາມາດຍົກລະດັບໄດ້, ໃຊ້ປະໂຫຍດຈາກອິນເຕີເຟດ PCIe ແລະສະຫນອງຄວາມສາມາດໃນການປຸງແຕ່ງວັດສະດຸປ້ອນຈາກຫຼາຍເຖິງ 16 ຟີດກ້ອງຖ່າຍຮູບ. ສໍາລັບລະບົບເຊັ່ນດຽວກັບຕົ້ນແບບທີ່ໃຊ້ຮາດແວນອກຊັ້ນວາງ, ທາງເລືອກເພີ່ມເຕີມຄືການໃຊ້ປະໂຫຍດຈາກການຮອງຮັບ USB 3.2 ໃນຕົວ. ການ​ເຊື່ອມ​ຕໍ່​ສາຍ​ງ່າຍ​ດາຍ​ໃຫ້​ຄວາມ​ສາ​ມາດ​ໃນ​ການ​ທົດ​ສອບ AI algorithms ໃນ​ຄອມ​ພິວ​ເຕີ​, ການ​ນໍາ​ໃຊ້​ຊຸດ​ການ​ປະ​ເມີນ​ຮາດ​ແວ​ເພື່ອ​ເລີ່ມ​ຕົ້ນ​ການ​ຜະ​ລິດ​, ຫຼື​ສະ​ຫນອງ​ການ​ຍົກ​ລະ​ດັບ​ງ່າຍ​ດາຍ​ກັບ​ລະ​ບົບ​ທີ່​ມີ​ຢູ່​ແລ້ວ​.

ໂຄງສ້າງພື້ນຖານຊອບແວສໍາລັບການຫັນປ່ຽນຢ່າງບໍ່ຢຸດຢັ້ງ

ນັກພັດທະນາມີທາງເລືອກຂອງວິທີການທີ່ເຂົາເຈົ້າສາມາດໃຊ້ເພື່ອປັບປຸງການເຊື່ອມໂຍງຂອງຕົວເລັ່ງກັບໂປເຊດເຊີແລະ stacks ຊອບແວທີ່ກ່ຽວຂ້ອງຂອງມັນ. ໂມເດວຕ່າງໆສາມາດຖືກນຳໃຊ້ ແລະຈັດການໃນເວລາແລ່ນໂດຍໃຊ້ C++ ຫຼື Python application programming interfaces (APIs) ທີ່ໃຊ້ຢູ່ພາຍໃນສະພາບແວດລ້ອມ Linux ໃນ Arm ຫຼື Windows ໃນ x86. API runtime ຂອງ Kinara ສະຫນັບສະຫນູນຄໍາສັ່ງສໍາລັບການໂຫຼດແລະ unloading ແບບຈໍາລອງ, ຜ່ານການປ້ອນຂໍ້ມູນແບບຈໍາລອງ, ໄດ້ຮັບຂໍ້ມູນ inference ແລະການຄວບຄຸມຢ່າງເຕັມທີ່ຂອງ inferencing ແລະອຸປະກອນຮາດແວ.

Kinara - NXP - ຕົວຢ່າງການພັດທະນາກະແສ.
ການພັດທະນາຕົວຢ່າງ. (ພາບ: ກິນາຣາ)

ສະພາບແວດລ້ອມ GStreamer ສະຫນອງວິທີການອື່ນເພື່ອເຂົ້າເຖິງການປະຕິບັດຂອງເຄື່ອງເລັ່ງ. ໃນຖານະເປັນຫ້ອງສະຫມຸດທີ່ອອກແບບມາສໍາລັບການກໍ່ສ້າງຂອງຕາຕະລາງການຄິດໄລ່ຂອງອົງປະກອບການຈັດການສື່ມວນຊົນ, GStreamer ເຮັດໃຫ້ມັນງ່າຍທີ່ຈະປະກອບທໍ່ຂອງການກັ່ນຕອງທີ່ສາມາດປະກອບເຂົ້າໄປໃນຄໍາຮ້ອງສະຫມັກທີ່ສະລັບສັບຊ້ອນຫຼາຍທີ່ສາມາດ react ກັບການປ່ຽນແປງສະຖານະການໃນວິດີໂອທີ່ເຂົ້າມາແລະ sensor feeds.

ສໍາລັບ AI inferencing SDK ເຊັ່ນ Kinara’s ສາມາດເອົາແບບຈໍາລອງທີ່ໄດ້ຮັບການຝຶກອົບຮົມໃນຫຼາຍຮູບແບບ, ລວມທັງ TensorFlow, PyTorch, ONNX, Caffe2, ແລະ MXNet, ແລະສະຫນອງການສະຫນັບສະຫນູນໂດຍກົງສໍາລັບຫຼາຍຮ້ອຍແບບເຊັ່ນ YOLO, TFPose, EfficientNet, ເຊັ່ນດຽວກັນກັບເຄືອຂ່າຍ transformer. . ນີ້ສະຫນອງສະພາບແວດລ້ອມທີ່ສົມບູນແບບສໍາລັບການເພີ່ມປະສິດທິພາບໂດຍຜ່ານການປະລິມານ, ການນໍາໃຊ້ການປັບອັດຕະໂນມັດເພື່ອຮັບປະກັນຄວາມຖືກຕ້ອງຂອງຕົວແບບຖືກຮັກສາໄວ້, ແລະກໍານົດການປະຕິບັດໃນເວລາແລ່ນ. ດ້ວຍເວທີດັ່ງກ່າວມັນເປັນໄປໄດ້ທີ່ຈະໃຫ້ຄວາມເຂົ້າໃຈກ່ຽວກັບຮູບແບບການປະຕິບັດເພື່ອອໍານວຍຄວາມສະດວກໃນການເພີ່ມປະສິດທິພາບແລະການປັບຕົວກໍານົດການ. ເຄື່ອງຈຳລອງແບບບິດເບືອນຄວາມຖືກຕ້ອງເຮັດໃຫ້ວິສະວະກອນປະເມີນປະສິດທິພາບກ່ອນທີ່ຈະນຳໃຊ້ກັບຊິລິຄອນ.

ສະຫຼຸບ, ເນື່ອງຈາກ AI ກາຍເປັນສ່ວນຫນຶ່ງທີ່ສໍາຄັນຂອງລະບົບຝັງຕົວທີ່ເພີ່ມຂຶ້ນ, ມັນເປັນສິ່ງສໍາຄັນທີ່ຈະສາມາດລວມເອົາຫນ້າທີ່ inferencing ເຂົ້າໄປໃນລະດັບຄວາມກ້ວາງຂອງເວທີເພື່ອດູແລຄວາມຕ້ອງການພັດທະນາ. ນີ້ຫມາຍຄວາມວ່າສາມາດປັບຕົວເລັ່ງທີ່ມີຄວາມຍືດຫຍຸ່ນກັບ SDK ທີ່ກ່ຽວຂ້ອງເພື່ອໃຫ້ລູກຄ້າສາມາດສົມທົບການເລັ່ງ AI ຂັ້ນສູງກັບລະບົບທີ່ມີຢູ່ແລ້ວຫຼືລະບົບຝັງຕົວໃຫມ່.


Kinara_Rehan_Hameed

Rehan Hameed ໄດ້ຮັບປະລິນຍາເອກຈາກມະຫາວິທະຍາໄລ Stanford ບ່ອນທີ່ລາວເຮັດວຽກກ່ຽວກັບການອອກແບບໂປເຊດເຊີທີ່ມີປະສິດທິພາບດ້ານພະລັງງານແລະສະຖາປັດຕະຍະກໍາ multiprocessor polymorphic ແລະຮ່ວມກັນປະດິດສະຖາປັດຕະຍະກໍາ Kinara. ໃນປີ 2014 ລາວໄດ້ຮ່ວມກໍ່ຕັ້ງ Kinara ແລະໃນປັດຈຸບັນເປັນ CTO ບ່ອນທີ່ລາວສຸມໃສ່ການຂັບລົດວິໄສທັດດ້ານເຕັກໂນໂລຢີຂອງບໍລິສັດ, ລວມທັງການວິວັດທະນາການຢ່າງຕໍ່ເນື່ອງຂອງຊໍແວ stack ແລະສະຖາປັດຕະຍະກໍາຊິລິໂຄນ. ກ່ອນຫນ້ານີ້ລາວໄດ້ເຮັດວຽກກ່ຽວກັບການອອກແບບຂອງຊິບຫຼາຍແລະສູດການຄິດໄລ່ສໍາລັບການປະມວນຜົນສຽງແລະວິໄສທັດ.


ເນື້ອຫາທີ່ກ່ຽວຂ້ອງ:



Categories: AiHome

0 Comments

Leave a Reply

Avatar placeholder

Your email address will not be published. Required fields are marked *