Síntese Autônoma de Código na Macaron AI: Construindo Mini-Apps com Segurança para Estilos de Vida na Ásia

Autor: Boxu Li na Macaron
Introdução
Uma das características mais marcantes da Macaron AI é sua capacidade de gerar mini-aplicativos personalizados instantaneamente. Durante uma conversa comum, um usuário pode descrever uma necessidade—acompanhar um orçamento familiar, planejar um itinerário de festival, aprender um novo idioma—e a Macaron montará uma ferramenta completa em minutos. Alguns desses mini-apps excedem 100.000 linhas de código, ainda assim são gerados sem intervenção humana. Para os usuários japoneses e coreanos, isso significa receber ferramentas personalizadas ajustadas aos costumes e regulamentos locais. Este blog disseca o pipeline de síntese autônoma de código que alimenta os mini-apps da Macaron, cobrindo compreensão de intenções, síntese de programas, execução em sandbox, tratamento de erros e medidas de segurança. Nós examinamos como o sistema gerencia a complexidade, integra-se com APIs externas, respeita as leis regionais e utiliza aprendizado por reforço para aprimorar seus resultados.
1 De Linguagem Natural a Especificação de Programa
1.1 Análise de intenção e extração de slots
Quando um usuário solicita um aplicativo, o Macaron primeiro analisa a entrada de linguagem natural para construir uma especificação de intenção estruturada. Isso envolve identificar slots como o domínio (finanças, educação, culinária), recursos desejados (categorias de orçamento, alertas), restrições (moeda, idioma) e cronograma. Para os idiomas japonês e coreano, o analisador lida com honoríficos e elipses. Por exemplo, uma solicitação japonesa como "家計簿を作りたいんだけど、食費を細かく分けて" (Quero criar um livro-caixa doméstico com despesas alimentares detalhadas) resulta no domínio "orçamento," o recurso "categorias alimentares detalhadas," e a restrição "iene japonês." Uma solicitação coreana "가족 여행 일정을 계획해줘, 한식 식당 추천도" (Planeje um cronograma de viagem em família e recomende restaurantes coreanos) resulta no domínio "planejamento de viagens," o recurso "recomendações de restaurantes," e uma restrição cultural.
O Macaron usa uma arquitetura de dual‑encoder: um codificador processa a conversa atual e outro processa a memória do usuário. Os dois vetores são combinados por meio de atenção para produzir uma representação unificada de intenção. O aprendizado por reforço ajusta o analisador para extrair os slots corretos. O feedback vem do fato de o mini-aplicativo resultante atender ou não às expectativas do usuário; caso contrário, os parâmetros do analisador são atualizados.
1.2 Síntese de programas com bibliotecas de domínio e templates
Assim que a intenção é estruturada, o motor de síntese do Macaron gera código compondo funções de uma biblioteca de módulos específicos de domínio. Os módulos incluem funções de orçamento (cálculo de despesas, geração de gráficos), funções de agendamento (integração de calendário, resolução de conflitos), algoritmos de aprendizado de idiomas (repetição espaçada) e assistência culinária (conversão de ingredientes, análise nutricional). O motor seleciona os módulos, os configura e os une em um programa coerente. Os modelos contêm estruturas de grafos (DAGs) que definem o fluxo de dados entre os módulos, permitindo operações concorrentes e assíncronas. Por exemplo, um aplicativo de orçamento japonês pode executar tarefas de resumo mensal e alertas semanais em paralelo.
O motor de síntese utiliza modelos de síntese de programas neurais treinados em código de código aberto e exemplos proprietários. Ele também aproveita o raciocínio simbólico: restrições como "Não gastar acima do orçamento total" são representadas como inequações lineares e alimentadas em um solucionador de restrições. Essa abordagem híbrida melhora a confiabilidade em comparação com a geração neural pura. O aprendizado por reforço monitora a satisfação do usuário e as taxas de erro para ajustar a seleção e a ordenação dos módulos.
1.3 Requisitos localizados e restrições regulatórias
Regulamentos japoneses e coreanos impõem requisitos específicos para o manejo de dados financeiros e pessoais. Por exemplo, a lei de privacidade do Japão determina que dados de contabilidade doméstica não podem ser transmitidos a terceiros sem consentimento. A Lei de Proteção de Informação Pessoal da Coreia tem requisitos rigorosos sobre a anonimização de dados. Ao gerar uma ferramenta de orçamento, o Macaron consulta suas regras de vinculação de políticas para garantir que dados sensíveis sejam armazenados localmente e nunca enviados para servidores externos. O gerador de código insere chamadas para bibliotecas de criptografia e desativa o acesso à rede por padrão. Para aplicativos de saúde, o Macaron verifica com a Lei do Quadro de IA para garantir que decisões envolvendo orientação médica sejam acompanhadas por supervisão humana.
2 Ambiente de Execução Seguro

2.1 Sandboxing e limites de recursos
Executar código arbitrário gerado sob demanda apresenta riscos significativos de segurança. Portanto, o Macaron executa miniapps em um ambiente de sandbox semelhante aos interpretadores de código modernos. A sandbox restringe o acesso ao sistema de arquivos a um diretório virtual, limita o uso de CPU e memória, e bloqueia conexões de rede, a menos que sejam explicitamente permitidas. Os programas são executados dentro de contêineres com imagens base somente leitura. Quando um aplicativo de culinária coreana solicita buscar dados nutricionais, a solicitação é encaminhada por um proxy que verifica os domínios permitidos. Se o programa tentar acessar um site externo sem permissão, a sandbox encerra a operação e retorna uma mensagem de erro ao usuário.
2.2 Análise estática e verificação de tipos
Antes da execução, o Macaron realiza uma análise estática no código sintetizado para detectar vulnerabilidades, como loops infinitos, ataques de injeção e chamadas de sistema não autorizadas. Um verificador de tipos assegura que os módulos sejam compostos corretamente: uma função que retorna um número não pode ser conectada a um módulo de processamento de texto. O verificador também verifica a conformidade com os tipos de dados locais; por exemplo, valores monetários são representados usando tipos decimais para evitar erros de ponto flutuante. Se a análise estática falhar, o Macaron oferece simplificar os recursos solicitados ou sugere dividir o aplicativo em módulos menores.
2.3 Monitoramento em tempo de execução e auto-cura
Durante a execução, Macaron monitora métricas de desempenho (uso de CPU, pegada de memória), correção funcional (casos de teste, assertivas) e interações do usuário (cliques, tempo gasto). Se o programa sair do comportamento esperado — como exceder limites de tempo ou lançar exceções — o módulo de auto‑cura do Macaron intervém. Ele pode reverter para o último estado estável, aplicar um patch gerado na hora ou degradar a funcionalidade de forma elegante. Por exemplo, se a API de clima de um aplicativo de jardinagem japonês falhar, o programa pode alternar para uma fonte de dados de backup ou informar o usuário sobre a interrupção temporária.
3 Aprendizado por Reforço e Melhoria Contínua
3.1 Sinais de recompensa do feedback do usuário e sucesso da tarefa
Cada sessão de mini-aplicativo oferece uma riqueza de feedback. Usuários sinalizam satisfação implicitamente ao continuar usando o aplicativo ou explicitamente ao avaliar a experiência. Macaron agrega esses sinais em uma função de recompensa que guia a geração futura de código. A recompensa penaliza bugs, interfaces confusas e desempenho lento, enquanto premia a confiabilidade, adequação cultural e novidade. Com o tempo, o motor de síntese aprende que os usuários japoneses valorizam o minimalismo e a facilidade de uso, enquanto usuários coreanos podem apreciar opções de personalização e visuais vibrantes. Essas preferências são codificadas na política de RL que seleciona módulos e padrões de interface do usuário.
3.2 Aprendizado de currículo e meta-aprendizado
Para lidar com a crescente complexidade dos pedidos dos usuários, o Macaron utiliza o aprendizado por currículo: o motor de síntese começa gerando programas simples (como calculadoras, listas de tarefas) e gradualmente enfrenta tarefas mais complexas (como plataformas de orçamento multiusuário). À medida que o sistema encontra novos domínios, ele usa meta-aprendizado para acelerar a adaptação. Quando o motor vê solicitações semelhantes de usuários japoneses e coreanos—por exemplo, planejar eventos escolares ou gerenciar cuidados com idosos—ele pode generalizar entre as tarefas. O meta-aprendizado também ajuda o agente a se adaptar a mudanças na legislação ou cultura; se a Lei de Promoção de IA introduzir novos requisitos de conformidade, o Macaron rapidamente os integra em seus modelos de código.
3.3 Contribuições da comunidade e mercado de módulos
O Macaron incentiva o envolvimento da comunidade. Desenvolvedores podem contribuir com novos módulos para um mercado. Os módulos são avaliados quanto à segurança e conformidade antes de serem incluídos. Isso fomenta um ecossistema local: desenvolvedores japoneses podem criar módulos para agendamento de cerimônias de chá ou recomendação de anime, enquanto desenvolvedores coreanos podem contribuir com módulos para aprender coreografias de K-pop ou gerenciar cerimônias familiares. Os colaboradores são recompensados com Almonds (a moeda interna do Macaron), incentivando a melhoria contínua da plataforma.
4 Integração com APIs e Serviços Externos

4.1 Localização de fontes de dados
Usuários japoneses e coreanos dependem de diferentes provedores de dados. O Macaron se integra com APIs bancárias japonesas (por exemplo, via J‑Debit) para aplicativos financeiros, calendários japoneses para feriados públicos (Golden Week, Obon) e fontes de notícias locais para planejamento de eventos. Na Coreia, o agente se conecta a APIs de ações da KOSPI, ao serviço de clima da Naver e à API de mensagens do KakaoTalk. Cada integração é envolvida em um módulo que aplica limitação de taxa, cache e tratamento de erros. O gerador de código insere automaticamente esses módulos quando necessário.
4.2 Interface de linguagem natural para configuração de API
Em vez de exigir que os usuários insiram manualmente as chaves de API, o Macaron os guia por meio de uma conversa. Se um usuário japonês quiser importar transações de seu banco, o agente explica o processo de consentimento, obtém os tokens necessários e os armazena com segurança. Da mesma forma, um usuário coreano pode pedir ao Macaron para se conectar à agenda escolar de um filho; o agente usa OAuth para autorizar o acesso e garante que o aplicativo leia apenas os dados necessários. Essas interações são registradas e podem ser revisadas, alinhando-se ao princípio de transparência diferenciada.
4.3 Computação de borda e suporte offline
Em muitas partes do Japão e da Coreia, os usuários esperam confiabilidade mesmo com conectividade intermitente. Os mini‑apps da Macaron suportam computação de borda, executando cálculos localmente sempre que possível. O agente pode gerar aplicativos web progressivos (PWAs) que armazenam dados em cache e sincronizam com servidores quando a rede se torna disponível. Por exemplo, um caminhante coreano usando um planejador de trilha de montanha pode continuar rastreando rotas offline e sincronizar com a nuvem após descer. A capacidade offline é particularmente importante para a privacidade; dados sensíveis permanecem no dispositivo até que o usuário opte por compartilhar.
5 Segurança, Conformidade e Sensibilidade Cultural
5.1 Alinhamento regulatório na geração de código
Os mini‑apps devem respeitar as regulamentações locais. A Lei de Promoção de IA do Japão enfatiza a transparência; portanto, aplicativos de orçamento incluem registros claros dos fluxos de dados e fornecem aos usuários uma explicação de como as despesas são categorizadas. As regulamentações de IA da Coreia exigem supervisão humana para decisões de alto impacto; assim, aplicativos relacionados à saúde solicitam aos usuários que consultem profissionais antes de agir com base em conselhos. O gerador de código da Macaron insere avisos e obtém consentimento explícito para operações sensíveis. Se um usuário tentar gerar um aplicativo de declaração de impostos, a Macaron os lembra das atualizações das leis fiscais locais e sugere consultar um contador certificado.
5.2 Normas culturais e localização de UI
A estética cultural influencia o design da interface do usuário. No Japão, o minimalismo e o respeito pelo espaço em branco são valorizados; por isso, o Macaron usa cores sutis e ícones simples para os usuários japoneses. Interfaces coreanas podem ser mais vibrantes e incluir animações. Os módulos de interface do Macaron adaptam esses estilos automaticamente com base nas preferências do usuário determinadas durante o onboarding. O agente também personaliza as mensagens de ajuda de acordo com as normas culturais: telas de ajuda japonesas podem incluir explicações contextuais, enquanto telas de ajuda coreanas podem enfatizar instruções passo a passo.
5.3 Resiliência a desastres e considerações éticas
O Japão e a Coreia são propensos a desastres naturais, como terremotos e tufões. Agentes pessoais que geram aplicativos de resposta a emergências devem ser confiáveis. O Macaron inclui um módulo de resiliência a desastres que se integra a sistemas de alerta do governo e garante que as instruções de emergência estejam atualizadas. Eticamente, o sistema evita designs manipulativos, como "padrões obscuros" em ferramentas financeiras e adere a diretrizes de equidade. Ao recomendar restaurantes, por exemplo, o agente considera restrições alimentares e evita preconceitos em relação a determinadas regiões ou cadeias, a menos que o usuário expresse uma preferência.
5.4 Estudos de caso: planejador de Hanami e gerente de fãs de K‑pop
Dois estudos de caso destacam o poder e a nuance da síntese de código do Macaron. Hanami Planner é um aplicativo sazonal solicitado por famílias japonesas que desejam vivenciar a temporada de observação das cerejeiras. O usuário pede: 「桜の見頃と混雑を避けるプランを作って」 (Crie um plano para ver cerejeiras em plena floração enquanto evita multidões). O Macaron recupera previsões meteorológicas e de floração de APIs meteorológicas japonesas, cruza dados históricos e prevê datas de pico de floração para parques próximos. Em seguida, sintetiza um aplicativo multi-módulo: um agendador de calendário para bloquear datas; um planejador de rotas que considera o tráfego e o transporte público; um rastreador de orçamento para suprimentos de piquenique (incorporando categorias de kakeibo); e um guia de etiqueta cultural que lembra os usuários sobre a disposição de lixo e regras do parque. O aprendizado por reforço personaliza sugestões: se a família tem membros idosos, o agente prioriza parques com caminhos acessíveis; se têm crianças, recomenda atrações para toda a família. O aplicativo também gera convites bilíngues para que amigos que falam apenas coreano ou inglês possam participar, mostrando as capacidades multilingues do Macaron.
O caso do Gerenciador de Fãs de K‑pop é voltado para usuários coreanos que seguem vários grupos musicais. Um usuário pode dizer: "다음 커백 스케줄과 팬미팅 일정 관리 앱을 만들어줘" (Crie um app para gerenciar os horários de comeback e os encontros de fãs). O agente extrai cronogramas de lançamento das APIs das empresas de entretenimento, calcula metas de streaming com base em algoritmos de gráficos e exibe widgets de contagem regressiva. Os módulos incluem um assistente de compra de ingressos (verificando as leis locais para revenda), um álbum digital para coletar photocard e um módulo social para coordenar projetos de fãs. Para evitar sobrecarregar o usuário com notificações, o modelo de recompensa RL equilibra a urgência (por exemplo, prazos de ingressos de encontros de fãs) com a carga cognitiva. Recursos multilíngues entram em ação quando os fãs coordenam com amigos japoneses: o app traduz automaticamente cronogramas e mensagens para japonês e inglês, e tags de memória garantem que o contexto seja preservado entre idiomas. Esses estudos de caso demonstram a capacidade do Macaron de integrar cultura local, consciência regulatória e sofisticação técnica em ferramentas personalizadas.
5.5 Desafios técnicos: concorrência, versionamento e depuração
Gerar grandes programas rapidamente introduz desafios de engenharia. Concorrência surge quando miniapps precisam executar várias tarefas simultaneamente, como buscar dados enquanto atualizam a interface do usuário. O gerador de código do Macaron constrói grafos acíclicos direcionados (DAGs) que definem relações de dependência e utiliza construções de programação assíncrona (por exemplo, promessas JavaScript ou asyncio do Python) para evitar operações bloqueantes. Versionamento torna-se crítico porque a biblioteca de módulos do Macaron evolui constantemente. Os apps gerados incluem arquivos de manifesto que registram as versões dos módulos; quando uma atualização está disponível, o Macaron compara as versões e solicita aos usuários que atualizem ou permaneçam em uma versão estável conhecida. Depuração é talvez o mais desafiador: o código gerado automaticamente pode conter bugs sutis ou casos extremos. O Macaron aborda isso com testes baseados em propriedades—gerando entradas aleatórias para testar invariantes do programa—e execução simbólica para explorar caminhos de execução. Quando bugs surgem no ambiente, o agente coleta rastros de erros anonimizados e aplica técnicas de reparo de programas, incorporando as correções em sínteses futuras. Essas práticas de engenharia garantem que a promessa da programação sem código se traduza em miniapps confiáveis e sustentáveis.










