Apple M4 और AI training: Neural Engine की छिपी क्षमता सामने आई

Apple M4 Neural Engine से AI मॉडल ट्रेन किए गए
© T. Feodor

0X0SOJALSEC नाम से काम करने वाले एक सुरक्षा शोधकर्ता और डेवलपर का कहना है कि उन्होंने Apple की उन सीमाओं को पार कर लिया है, जो आमतौर पर M4 चिप्स में मौजूद Neural Engine को AI मॉडल की पूरी training के लिए इस्तेमाल होने से रोकती हैं।

Apple का neural engine सामान्य तौर पर पहले से trained models और डिवाइस पर चलने वाले स्थानीय AI features को तेज करने के लिए इस्तेमाल होता है। लेकिन इस enthusiast ने इसे कहीं ज्यादा जटिल कामों में लगा दिया, जिनमें backpropagation के साथ transformer models की training भी शामिल है।

इसके लिए Model Intermediate Language (MIL) पर आधारित एक custom compiler layer तैयार की गई। यह Neural Engine से सीधे संपर्क की अनुमति देती है और Core ML तथा Metal जैसे सामान्य Apple tools को bypass करती है। execution के दौरान data RAM में रहता है, जिससे storage पर लगातार लिखने से आने वाली latency कम होती है।

डेवलपर ने training recovery mechanism भी बनाया है: अगर process freeze हो जाए या रुक जाए, तो system आखिरी checkpoint से काम जारी रख सकता है और पहले की progress नहीं खोती।

Project का source code पहले ही GitHub पर प्रकाशित हो चुका है। लेखक के मुताबिक, शुरुआती tests ने high speed दिखाई: M4 chips पर transformer type models की कुछ training stages milliseconds में पूरी हो रही थीं।

Apple developers को Neural Engine के जरिए neural networks train करने की आधिकारिक सुविधा नहीं देता और इस block को मुख्य रूप से inference accelerator के रूप में पेश करता है। लेकिन reverse engineering से संकेत मिलता है कि chips की hardware क्षमता कंपनी के public tools से कहीं अधिक है।

अगर यह तरीका practical रूप से उपयोगी साबित होता है, तो Mac computers और iPad tablets छोटे AI models को cloud services पर निर्भर हुए बिना local development और testing के लिए ज्यादा दिलचस्प platform बन सकते हैं।

यह खोज फिर वही सवाल उठाती है कि Apple hardware में कितनी capabilities छिपी हुई हैं, और उनमें से कितनी silicon की वजह से नहीं, बल्कि कंपनी की software limits की वजह से inaccessible रहती हैं।