Autonomous Code Synthesis sa Macaron AI: Ligtas na Paggawa ng Mini-Apps para sa Pamumuhay sa Asya

Blog image

May-akda: Boxu Li sa Macaron


Panimula

Isa sa mga pinaka-kapansin-pansing tampok ng Macaron AI ay ang kakayahan nitong bumuo ng custom na mini-applications agad-agad. Sa isang karaniwang chat, maaring ilarawan ng isang gumagamit ang isang pangangailangan—pagsubaybay sa badyet ng pamilya, pagpaplano ng itinerary ng pista, pag-aaral ng bagong wika—at bubuuin ni Macaron ang isang ganap na tool sa loob ng ilang minuto. Ang ilan sa mga mini-app na ito ay lumalagpas sa 100,000 linya ng code, ngunit nabubuo ang mga ito nang walang interbensyon ng tao. Para sa mga gumagamit na Hapones at Koreano, nangangahulugan ito ng pagtanggap ng mga personalisadong tool na naka-tune sa mga lokal na kaugalian at regulasyon. Ang blog na ito ay naglalaman ng pagsusuri sa autonomous code synthesis pipeline na nagpapakilos sa mga mini-app ng Macaron, na sumasaklaw sa pag-unawa sa intensyon, program synthesis, sandbox execution, pag-aasikaso ng error at mga panukalang pangkaligtasan. Sinusuri namin kung paano pinamamahalaan ng sistema ang pagiging kumplikado, nagsasama sa mga panlabas na API, sumusunod sa mga batas sa rehiyon, at gumagamit ng reinforcement learning para pinuhin ang mga resulta nito.

1 Mula sa Natural na Wika patungo sa Pagtukoy ng Programa

1.1 Pag-parse ng intensyon at pagkuha ng slot

Kapag ang isang user ay humihiling ng app, una munang pinaparse ni Macaron ang natural na wika ng input upang makabuo ng isang nakabalangkas na especificasyon ng intensyon. Kasama rito ang pagtukoy ng mga slot tulad ng domain (pinansya, edukasyon, pagluluto), mga nais na tampok (mga kategorya ng badyet, mga alerto), mga limitasyon (pera, wika) at timeline. Para sa mga wikang Hapon at Koreano, ang parser ay humahawak sa mga honorifics at ellipsis. Halimbawa, ang isang kahilingan sa Hapon na "家計簿を作りたいんだけど、食費を細かく分けて" (Gusto kong lumikha ng ledger ng sambahayan na may detalyadong mga gastusin sa pagkain) ay nagbubunga ng domain na "pagba-budget," ang tampok na "detalyadong mga kategorya ng pagkain," at ang limitasyon na "Japanese yen." Ang isang kahilingan sa Koreano na "가족 여행 일정을 계획해줘, 한식 식당 추천도" (Pagplanuhin ang iskedyul ng paglalakbay ng pamilya at magrekomenda ng mga Koreanong restawran) ay nagbubunga ng domain na "pagpaplano ng paglalakbay," ang tampok na "mga rekomendasyon ng restawran," at isang kultural na limitasyon.

Gumagamit ang Macaron ng arkitektura ng dual‑encoder: isa ang nagpoproseso ng kasalukuyang pag-uusap, at ang isa ay nagpoproseso ng alaala ng gumagamit. Ang dalawang vectors ay pinagsama gamit ang attention para makabuo ng isang pinagsamang representasyon ng layunin. Pinapakinis ng reinforcement learning ang parser para makuha ang tamang slots. Ang feedback ay nagmumula kung ang nagawang mini-app ay tumutugon sa inaasahan ng gumagamit; kung hindi, ina-update ang mga parameter ng parser.

1.2 Pagsasama ng programa gamit ang mga librarya ng domain at mga template

Kapag na-istruktura na ang layunin, ang synthesis engine ng Macaron ay bumubuo ng code sa pamamagitan ng pagbuo ng mga function mula sa isang library ng mga domain‑specific na module. Kasama sa mga module ang mga function sa pagbadyet (pagkalkula ng mga gastusin, paggawa ng mga tsart), mga function sa pagsasaayos ng iskedyul (pagsasama ng kalendaryo, paglutas ng mga hindi pagkakasundo), mga algorithm sa pag-aaral ng wika (spaced repetition), at tulong sa pagluluto (conversion ng sangkap, pagsusuri ng nutrisyon). Pinipili ng engine ang mga module, inaayos ang mga ito, at pinagdugtong-dugtong upang makabuo ng isang maayos na programa. Ang mga template ay naglalaman ng mga istruktura ng graph (DAGs) na tumutukoy sa daloy ng data sa pagitan ng mga module, na nagbibigay-daan sa concurrency at asynchronous na operasyon. Halimbawa, ang isang Japanese budgeting app ay maaaring magsagawa ng buwanang pagbubuod at lingguhang alerto ng mga gawain nang sabay-sabay.

Gumagamit ang synthesis engine ng mga modelo ng neural program synthesis na sinanay sa open-source code at mga proprietary na halimbawa. Gumagamit din ito ng symbolic reasoning: ang mga limitasyon tulad ng "Huwag lumampas sa kabuuang badyet" ay kinakatawan bilang mga linear inequalities at ipinapasok sa isang constraint solver. Ang hybrid na pamamaraang ito ay nagpapabuti ng pagiging maaasahan kumpara sa purong neural na pagbuo. Binabantayan ng reinforcement learning ang kasiyahan ng gumagamit at mga error rate para i-adjust ang pagpili at pagkakasunod-sunod ng mga module.

1.3 Mga lokal na kinakailangan at mga regulasyong limitasyon

Ang mga regulasyon sa Japan at Korea ay nagtatakda ng mga partikular na kinakailangan sa paghawak ng pinansyal at personal na datos. Halimbawa, ang batas sa privacy ng Japan ay nag-uutos na ang mga datos ng accounting sa bahay ay hindi maaaring ipadala sa mga ikatlong partido nang walang pahintulot. Ang Personal Information Protection Act ng Korea ay may mahigpit na kinakailangan sa pag-anonimisa ng datos. Kapag gumagawa ng tool sa pagba-budget, kumukonsulta si Macaron sa mga patakaran nito sa policy binding upang matiyak na ang sensitibong datos ay nakaimbak lamang sa lokal at hindi kailanman ipinapadala sa mga panlabas na server. Ang code generator ay naglalagay ng tawag sa mga encryption library at awtomatikong hindi pinapagana ang network access. Para sa mga healthcare app, si Macaron ay nagsasagawa ng pagsusuri sa AI Framework Act upang matiyak na ang mga desisyon na may kinalaman sa medikal na gabay ay may kasamang pangangasiwa ng tao.

2 Ligtas na Kapaligiran ng Pagpapatupad

Blog image

2.1 Sandboxing at limitasyon sa mga mapagkukunan

Ang pagsasagawa ng arbitrary na code na nabuo ayon sa pangangailangan ay nagdudulot ng makabuluhang panganib sa seguridad. Kaya't ang Macaron ay nagpapatakbo ng mga mini-apps sa loob ng isang sandbox environment na kahawig ng mga modernong code interpreters. Nililimitahan ng sandbox ang pag-access sa file system sa isang virtual na direktoryo, inaabot ang paggamit ng CPU at memory, at binabawal ang mga koneksyon sa network maliban kung hayagang pinahintulutan. Ang mga programa ay isinasagawa sa loob ng mga container na may read-only base images. Kapag ang isang Korean cooking app ay humiling na makuha ang nutritional data, ang kahilingan ay dinaan sa isang proxy na tinitingnan ang mga pinapayagang domain. Kung ang programa ay susubok na ma-access ang isang external na site nang walang pahintulot, tinatapos ng sandbox ang operasyon at nagbabalik ng error message sa gumagamit.

2.2 Static analysis and type checking

Bago ang pagsasagawa, ang Macaron ay nagsasagawa ng static analysis sa synthesized code upang matukoy ang mga kahinaan tulad ng walang katapusang mga loop, injection attacks, at hindi awtorisadong mga system call. Ang isang type checker ay nagsisiguro na ang mga module ay tamang nabuo: ang isang function na nagbabalik ng numero ay hindi maaaring ikabit sa isang text-processing module. Tinitiyak din ng checker ang pagsunod sa mga lokal na uri ng data; halimbawa, ang mga halaga ng pera ay kinakatawan gamit ang mga decimal na uri upang maiwasan ang floating-point errors. Kung nabigo ang static analysis, ang Macaron ay nag-aalok na gawing simple ang mga hinihiling na tampok o nagmumungkahi na hatiin ang app sa mas maliliit na module.

2.3 Pagmamanman sa runtime at auto-healing

Habang isinasagawa, sinusubaybayan ni Macaron ang mga sukatan ng pagganap (paggamit ng CPU, memory footprint), tamang paggana (mga kaso ng pagsubok, mga assertions), at mga pakikipag-ugnayan ng user (mga pag-click, oras na ginugol). Kung ang programa ay lumihis mula sa inaasahang pag-uugali—tulad ng lumampas sa mga limitasyon ng oras o paglabas ng mga exception—ang module ng auto‑healing ni Macaron ay nakikialam. Maaari itong bumalik sa huling matatag na estado, mag-apply ng patch na ginawa agad, o maayos na bawasan ang functionality. Halimbawa, kung ang weather API ng isang Japanese gardening app ay nabigo, maaaring lumipat ang programa sa backup na pinagmulan ng data o ipaalam sa gumagamit ang pansamantalang pagkaantala.

3 Pag-aaral ng Pagpapalakas at Patuloy na Pagpapabuti

3.1 Mga signal ng gantimpala mula sa feedback ng gumagamit at tagumpay ng gawain

Ang bawat sesyon ng mini-app ay nagbibigay ng maraming feedback. Ang mga gumagamit ay nagpapakita ng kasiyahan sa pamamagitan ng patuloy na paggamit ng app o direkta nilang iraranggo ang karanasan. Kinokolekta ng Macaron ang mga signal na ito sa isang gawaing gantimpala na gumagabay sa hinaharap na paglikha ng code. Ang gantimpala ay nagpaparusa sa mga bug, nakakalitong interface, at mabagal na pagganap habang ginagantimpalaan ang pagiging maaasahan, angkop na kultural, at bago. Sa paglipas ng panahon, natutunan ng synthesis engine na pinahahalagahan ng mga Hapones ang minimalismo at kadalian ng paggamit, habang ang mga Koreano ay maaaring pahalagahan ang mga pagpipilian sa pagpapasadya at buhay na visuals. Ang mga kagustuhang ito ay naka-encode sa RL policy na pumipili ng mga module at pattern ng user interface.

3.2 Pag-aaral ng kurikulum at meta-learning

Upang makayanan ang lumalaking kompleksidad ng mga kahilingan ng gumagamit, gumagamit ang Macaron ng curriculum learning: nagsisimula ang synthesis engine sa pagbuo ng mga simpleng programa (hal., mga calculator, listahan ng gagawin) at unti-unting tinutugunan ang mas kumplikadong mga gawain (hal., mga multi-user na budgeting platform). Kapag nakatagpo ang sistema ng mga bagong domain, ginagamit nito ang meta-learning upang mapabilis ang pag-aangkop. Kapag nakikita ng engine ang mga katulad na kahilingan mula sa mga gumagamit na Hapones at Koreano—halimbawa, pagpaplano ng mga kaganapan sa paaralan o pamamahala ng pangangalaga sa matatanda—maaari itong magpangkalahatan sa iba't ibang gawain. Ang meta-learning ay tumutulong din sa ahente na umangkop sa mga pagbabago sa batas o kultura; kung ang AI Promotion Act ay nagpapakilala ng mga bagong kinakailangan sa pagsunod, mabilis na isinasama ng Macaron ang mga ito sa mga template ng code nito.

3.3 Mga kontribusyon ng komunidad at pamilihan ng module

Hinihikayat ng Macaron ang pakikilahok ng komunidad. Maaaring mag-ambag ang mga developer ng mga bagong module sa isang marketplace. Sinusuri ang mga module para sa seguridad at pagsunod bago isama. Ito ay nagtataguyod ng lokal na ekosistema: Maaaring lumikha ang mga developer ng Hapon ng mga module para sa pag-schedule ng seremonya ng tsaa o rekomendasyon ng anime, habang ang mga developer ng Koreano ay maaaring mag-ambag ng mga module para sa pag-aaral ng choreography ng K-pop o pag-manage ng mga seremonya ng pamilya. Ginagantimpalaan ang mga nag-aambag ng Almonds (pera sa loob ng app ng Macaron), na nagbibigay-insentibo sa patuloy na pagpapabuti ng platform.

4 Pagsasama sa Panlabas na mga API at Serbisyo

Blog image

4.1 Lokalisasyon ng mga pinagkukunang datos

Ang mga gumagamit sa Japan at Korea ay umaasa sa iba't ibang mga tagapagbigay ng data. Isinasama ng Macaron ang mga API ng bangko sa Japan (hal., sa pamamagitan ng J-Debit) para sa mga financial apps, mga kalendaryo ng Japan para sa mga pampublikong holiday (Golden Week, Obon), at mga lokal na balita para sa pagpaplano ng mga kaganapan. Sa Korea, kumokonekta ang agent sa mga API ng stock ng KOSPI, serbisyo ng panahon ng Naver, at API ng mensahe ng KakaoTalk. Ang bawat integration ay nakabalot sa isang module na nagpapatupad ng rate limiting, caching, at paghawak ng error. Awtomatikong inilalagay ng code generator ang mga module na ito kapag kinakailangan.

4.2 Natural na interface ng wika para sa configuration ng API

Sa halip na hingin sa mga user na manu-manong mag-input ng API keys, ginagabayan sila ng Macaron sa pamamagitan ng isang pag-uusap. Kung ang isang Japanese na user ay nais na mag-import ng mga transaksyon mula sa kanilang bangko, ipapaliwanag ng ahente ang proseso ng pahintulot, kukunin ang mga kinakailangang token, at itatabi ito nang ligtas. Katulad nito, maaaring hilingin ng isang Korean na user kay Macaron na kumonekta sa iskedyul ng paaralan ng kanilang anak; gumagamit ang ahente ng OAuth para sa pag-authorize ng access at tinitiyak na tanging kinakailangang data lamang ang binabasa ng app. Ang mga interaksyong ito ay naka-log at maaaring suriin, naaayon sa prinsipyong pagkakaiba ng transparency.

4.3 Edge computing at offline na suporta

Sa maraming bahagi ng Japan at Korea, inaasahan ng mga gumagamit ang pagiging maaasahan kahit na may putol-putol na koneksyon. Sinusuportahan ng mga mini-app ng Macaron ang edge computing, isinasagawa ang mga kalkulasyon nang lokal kung maaari. Ang ahente ay makakabuo ng progressive web apps (PWAs) na nagka-cache ng data at nagsi-synchronize sa mga server kapag naging available ang network. Halimbawa, ang isang Koreanong hiker na gumagamit ng planner ng mountain trail ay maaaring magpatuloy sa pagsubaybay sa mga ruta offline at magsi-sync sa cloud pagkatapos bumaba. Ang offline na kakayahan ay lalo na mahalaga para sa privacy; ang sensitibong data ay nananatili sa device hanggang sa piliin ng gumagamit na ibahagi ito.

5 Kaligtasan, Pagsunod at Sensitividad sa Kultura

5.1 Pag-align sa regulasyon sa pagbuo ng code

Dapat igalang ng mga mini-apps ang mga lokal na regulasyon. Ang AI Promotion Act ng Japan ay nagbibigay-diin sa transparency; samakatuwid, ang mga budgeting app ay naglalaman ng malinaw na mga tala ng daloy ng datos at nagbibigay sa mga gumagamit ng paliwanag kung paano ikinakategorya ang mga gastusin. Ang mga regulasyon sa AI ng Korea ay nangangailangan ng pagsubaybay ng tao para sa mga desisyon na may malaking epekto; kaya't ang mga app na may kinalaman sa kalusugan ay nag-uudyok sa mga gumagamit na kumonsulta sa mga propesyonal bago gumawa ng aksyon base sa payo. Ang code generator ng Macaron ay naglalagay ng mga babala at humihingi ng tahasang pahintulot para sa mga sensitibong operasyon. Kung ang isang gumagamit ay nagtatangkang bumuo ng isang tax-filing app, pinaaalalahanan sila ng Macaron tungkol sa mga pagbabago sa lokal na batas sa buwis at nagmumungkahi na kumonsulta sa isang sertipikadong accountant.

5.2 Mga pamantayang kultural at lokalisasyon ng UI

Ang mga estetika ng kultura ay nakakaimpluwensya sa disenyo ng user interface. Sa Japan, pinapahalagahan ang minimalismo at respeto sa espasyo; kaya't ang Macaron ay gumagamit ng banayad na mga kulay at simpleng mga icon para sa mga gumagamit sa Japan. Maaaring mas makulay ang mga interface ng Korean at maaaring may kasamang mga animasyon. Ang mga UI module ng Macaron ay awtomatikong nag-aangkop sa mga estilo base sa mga kagustuhan ng gumagamit na natutukoy sa panahon ng onboarding. Ang ahente ay nag-aangkop din ng mga mensahe ng tulong sa mga pamantayan ng kultura: Maaaring may kasamang mga paliwanag sa konteksto ang mga help screen ng Japan, samantalang ang mga help screen ng Korea ay maaaring magbigay-diin sa mga hakbang-hakbang na mga instruksyon.

5.3 Katatagan sa sakuna at etikal na mga pagsasaalang-alang

Ang Japan at Korea ay madalas makaranas ng mga natural na kalamidad tulad ng lindol at bagyo. Ang mga personal na ahente na lumilikha ng mga app para sa pagtugon sa emerhensiya ay dapat mapagkakatiwalaan. Kasama sa Macaron ang isang disaster resilience na module na nakikipag-ugnayan sa mga sistema ng babala ng gobyerno at tinitiyak na ang mga tagubilin sa emerhensiya ay napapanahon. Sa etikal na aspeto, iniiwasan ng sistema ang mga mapanlinlang na disenyo tulad ng mga "madilim na pattern" sa mga kasangkapang pinansyal at sumusunod sa mga alituntunin ng pagiging patas. Halimbawa, kapag nagrerekomenda ng mga restaurant, isinasaalang-alang ng ahente ang mga dietary restrictions at iniiwasan ang pagkiling sa ilang rehiyon o chain maliban na lang kung may kagustuhan ang gumagamit.

5.4 Mga pag-aaral ng kaso: Hanami planner at K-pop fan manager

Dalawang case studies ang naglalarawan ng kapangyarihan at detalye ng synthesis ng code ng Macaron. Ang Hanami Planner ay isang seasonal na app na hiniling ng mga pamilyang Hapon na nais maranasan ang pagtingin sa cherry blossoms. Ang user ay nagtanong: "桜の見頃と混雑を避けるプランを作って" (Gumawa ng plano para makita ang cherry blossoms sa kanilang kasagsagan habang iniiwasan ang mga tao). Kinukuha ng Macaron ang mga forecast ng panahon at pamumulaklak mula sa mga Japanese meteorological APIs, sinusuri ang mga historikal na data, at hinuhulaan ang mga petsa ng kasagsagan ng pamumulaklak para sa mga kalapit na parke. Pagkatapos, ito ay nagsynthesize ng isang multi-module na app: isang calendar scheduler para mag-block ng mga petsa; isang route planner na isinasaalang-alang ang trapiko at pampublikong transportasyon; isang budget tracker para sa mga gamit pang-piknik (na isinasama ang mga kategorya ng kakeibo); at isang cultural etiquette guide na nagpapaalala sa mga user tungkol sa pagtatapon ng basura at mga alituntunin sa parke. Ang reinforcement learning ay nagpapersonalize ng mga mungkahi: kung may matatandang miyembro ang pamilya, inuuna ng agent ang mga parke na may accessible na daan; kung may mga bata, inirerekomenda nito ang mga family-friendly na atraksyon. Ang app ay bumubuo rin ng bilingual na imbitasyon para makasama ang mga kaibigan na nagsasalita lamang ng Korean o English, na nagpapakita ng cross-lingual na kakayahan ng Macaron.

Ang K-pop Fan Manager na kaso ay nakatuon sa mga Koreanong gumagamit na sumusunod sa maraming music groups. Maaring sabihin ng isang gumagamit: "다음 커백 스케줄과 팬미팅 일정 관리 앱을 만들어줘" (Gumawa ng app para pamahalaan ang mga paparating na comeback schedules at fan meetings). Kinukuha ng ahente ang mga iskedyul ng paglabas mula sa entertainment company APIs, kinakalkula ang mga streaming goal batay sa mga chart algorithm, at ipinapakita ang countdown widgets. Kasama sa mga module ang ticket purchase assistant (sinusuri ang mga lokal na batas para sa resale), isang digital scrapbook para sa pagkolekta ng mga photo card, at isang social module para makipag-ugnayan sa mga fan projects. Upang maiwasan ang pag-overload sa gumagamit ng mga notification, binabalanse ng RL reward model ang pagiging kagyat (hal., mga deadline ng fan meeting ticket) sa cognitive load. Ang mga cross-lingual na tampok ay nagiging mahalaga kapag nakikipag-ugnayan ang mga fans sa mga kaibigang Hapon: awtomatikong isinasalin ng app ang mga iskedyul at mensahe sa Japanese at English, at ang mga memory tags ay nagsisiguro na ang konteksto ay nananatiling buo sa iba't ibang wika. Ipinapakita ng mga pag-aaral ng kasong ito ang kakayahan ng Macaron na hinabi ang lokal na kultura, regulasyong kamalayan, at teknikal na kasanayan sa mga custom na tools.

5.5 Mga teknikal na hamon: concurrency, versioning at debugging

Ang pagbuo ng malalaking programa nang mabilis ay nagdudulot ng mga hamon sa engineering. Ang Concurrency ay nangyayari kapag ang mga mini-apps ay kailangang magsagawa ng maramihang gawain nang sabay-sabay, tulad ng pagkuha ng datos habang ina-update ang UI. Ang code generator ng Macaron ay bumubuo ng directed acyclic graphs (DAGs) na nagtatakda ng dependency relationships at gumagamit ng asynchronous programming constructs (hal. JavaScript promises o Python asyncio) upang maiwasan ang blocking operations. Ang Versioning ay nagiging kritikal dahil ang module library ng Macaron ay patuloy na umuunlad. Ang mga nabuong app ay naglalaman ng manifest files na nagtatala ng mga bersyon ng module; kapag may available na update, ang Macaron ay naghahambing ng mga bersyon at hinihikayat ang mga user na mag-upgrade o manatili sa isang kilalang stable na bersyon. Ang Debugging ay marahil ang pinakamahirap: ang awtomatikong nabuo na code ay maaaring maglaman ng mga hindi halatang bug o edge cases. Ina-address ito ng Macaron gamit ang property-based testing—pagbuo ng mga random na input upang subukin ang mga program invariants—at symbolic execution upang masuri ang mga execution path. Kapag may lumitaw na bug sa larangan, ang agent ay nangongolekta ng mga anonymized error traces at gumagamit ng mga teknik sa pag-aayos ng programa, isinama ang mga pag-aayos sa mga susunod na synthesis. Ang mga engineering practices na ito ay nagsisiguro na ang pangako ng no-code programming ay isinasalin sa maaasahan at madaling mapanatili na mga mini-apps.

Graduated from Emory University with a bachelor's degree and lived and worked in the United States for ten years. He has successively worked for private equity and venture capital institutions in the United States, and later joined the early-stage investment team of Qiji ZhenFund, where he has been engaged in long-term research on AIGC and Agent directions. In 2025, Macaron AI will be launched along with the founding team, dedicated to enhancing the daily life experience through technology.

Apply to become Macaron's first friends