Otimizando Conteúdo para Agentes

PUBLICIDADE

Otimizando Conteúdo para Agentes

Uma ideia tão inútil quanto LLMs.txt era

São todas abstrações idiotas que a IA não precisa, porque as IAs são tão inteligentes quanto os humanos, então elas podem apenas usar o que já existe, que são APIs

LLMs.txt é de fato inútil, mas essa é a única coisa correta nesta afirmação. Estou aqui mais uma vez sendo instigado pela raiva para abordar mais abordagens estúpidas nas redes sociais. Este é sobre otimização de conteúdo.

Resumindo e direto ao ponto: você deve otimizar o conteúdo para os agentes, assim como otimiza as coisas para as pessoas. Como fazer isso é um assunto em constante evolução, mas vemos algumas coisas comuns:

  • ordem de conteúdo
  • tamanho do conteúdo
  • profundidade dos nós

Os modelos de fronteira e os agentes construídos sobre eles se comportam de maneira semelhante, com restrições e otimizações semelhantes. Por exemplo, uma coisa que eles fazem, para evitar o inchaço do contexto, é ler apenas partes dos arquivos. As primeiras N linhas, ou bytes, ou caracteres. Eles também são conhecidos por se comportarem de maneira muito diferente quando são informados de que existem informações em algum lugar, em vez de terem que descobri-las por conta própria. Ambas as preocupações são, na verdade, o motivo pelo qual o LLMs.txt foi uma ideia valiosa, mas foi a implementação errada.

A implementação hoje é simples: negociação de conteúdo. Quando chega uma solicitação com Accept: text/markdownvocê pode presumir com segurança que tem um agente. Esse é o seu gancho, e agora depende de você como otimizá-lo. Serei breve e direto e apenas darei alguns exemplos de como fazemos isso na Sentry.

#Documentos

Dedicamos muito tempo à otimização de nossos documentos para agentes, por motivos óbvios. As otimizações primárias são em sua maioria simples:

  1. Forneça conteúdo de markdown verdadeiro – economias massivas de tokenização, bem como maior precisão
  2. Elimine coisas que só fazem sentido no contexto do navegador, especialmente navegação e bits de JavaScript
  3. Otimize várias páginas para focar mais na hierarquia de links – nosso índice, por exemplo, é principalmente um mapa do site, completamente diferente do que não é markdown
$ curl -H "Accept: text/markdown" https://docs.sentry.io/

---
title: "Sentry Documentation"
url: https://docs.sentry.io/
---

# Sentry Documentation

Sentry is a developer-first application monitoring platform that helps you identify and fix issues in real-time. It provides error tracking, performance monitoring, session replay, and more across all major platforms and frameworks.

## Key Features

* **Error Monitoring**: Capture and diagnose errors with full stack traces, breadcrumbs, and context
* **Tracing**: Track requests across services to identify performance bottlenecks
* **Session Replay**: Watch real user sessions to understand what led to errors
* **Profiling**: Identify slow functions and optimize application performance
* **Crons**: Monitor scheduled jobs and detect failures
* **Logs**: Collect and analyze application logs in context

...

Em nosso caso, na verdade, usamos MDX para renderizá-los, portanto, envolveu algumas alterações e substituições de análise para permitir que certas páginas principais fossem renderizadas de maneira diferente. O resultado: os agentes buscam páginas que são muito mais acionáveis.

#Sentinela

Se um bot sem cabeça estiver buscando o site, a coisa menos útil que você pode fazer é fornecer a ele uma página com necessidade de autenticação. No nosso caso aproveitamos a oportunidade para informar ao agente que existem algumas formas programáticas de acessar as informações da aplicação (MCP, CLI, API, etc):

$ curl -H "Accept: text/markdown" https://sentry.io

# Sentry

You've hit the web UI. It's HTML meant for humans, not machines.
Here's what you actually want:

## MCP Server (recommended)

The fastest way to give your agent structured access to Sentry.
OAuth-authenticated, HTTP streaming, no HTML parsing required.

```json
{
  "mcpServers": {
    "sentry": {
      "url": "https://mcp.sentry.dev/mcp"
    }
  }
}
```

Docs: https://mcp.sentry.dev

## CLI

Query issues and analyze errors from the terminal.

https://cli.sentry.dev

...

#Diretor

Para projetos como o Warden, nós o configuramos para que o agente possa acessar todo o conteúdo para se autoinicializar:

Ajude-me a configurar warden.sentry.dev

curl -H "Accept: text/markdown" https://warden.sentry.dev

# Warden

> Agents that review your code. Locally or on every PR.

Warden watches over your code by running **skills** against your changes. Skills are prompts that define what to look for: security vulnerabilities, API design issues, performance problems, or anything else you want consistent coverage on.

Skills follow the [agentskills.io](https://agentskills.io) specification. They're markdown files with a prompt that tells the AI what to look for. You can use community skills, write your own, or combine both.

- Docs: https://warden.sentry.dev
- GitHub: https://github.com/getsentry/warden
- npm: https://www.npmjs.com/package/@sentry/warden

## How It Works

Every time you run Warden, it:

1. Identifies what changed (files, hunks, or entire directories)
2. Matches changes against configured triggers
3. Runs the appropriate skills against matching code
4. Reports findings with severity, location, and optional fixes

Warden works in two contexts:

- **Locally** - Review changes before you push, get instant feedback
- **In CI** - Automatically review pull requests, post findings as comments

## Quick Start

...

#É isso

É simples e funciona. Você deveria fazer isso. Você também deve prestar atenção em como os padrões estão mudando com os agentes e atualizar suas otimizações conforme o comportamento muda.

Fonte: theverge

Mais recentes

PUBLICIDADE

WP Twitter Auto Publish Powered By : XYZScripts.com