Hugging Face는 웹 탐색 AI 도구 Open Computer Agent를 출시했습니다. 이 에이전트는 실제 웹 브라우저를 사용해 길 찾기나 티켓 예약을 인간처럼 수행하며, 오픈 소스로 제공되어 발전 가능성을 지니고 있습니다.
원문:
(이미지 제공: Hugging Face)
- Hugging Face가 웹 탐색을 대신 해주는 AI 도구를 출시했습니다.
- Open Computer Agent는 실제 웹 브라우저를 사용하여 길 찾기나 티켓 예약 같은 작업을 수행합니다.
- 이 에이전트와 공개 소스 데모는 화면에 표시된 내용을 보고 버튼을 클릭하고 양식을 작성하며, 인간처럼 단계별로 작업을 진행할 수 있습니다.
Hugging Face는 사람들이 온라인에서 심부름을 할 수 있는 반독립적인 AI 에이전트의 증가하는 수요에 따라 자신만의 접근 방식을 도입했습니다. 새로운 무료(Open Computer Agent)는 사용 범위가 제한적이지만, 웹 브라우저 안에 살고 있는 개인 비서와 같습니다.
직접 라이브 데모를 통해 체험해볼 수 있습니다. 인기 때문에 백로그로 인해 지연이나 오류가 발생할 수 있다는 점, 주의하세요.
관심 있을 수도 있습니다.
smolagents에서 컴퓨터 사용을 시작합니다! 🥳 -> 비전 모델이 더 강력해짐에 따라 복잡한 작동 워크플로를 지원할 수 있게 되었습니다. 특히, Qwen-VL 모델은 좌표를 통해 이미지의 어떤 요소든 위치를 파악할 수 있는 내장된 기반을 지원합니다. 따라서… pic.twitter.com/mI8MuWZkIS 2025년 5월 6일
에이전트 AI
Open Computer Agent는 OpenAI의 Operator, Browser Use, Proxy 1.0, 및 Opera의 Browser Operator와 같은 도구로 이어진 아이디어의 다른 철학이 적용된 것입니다. 이러한 도구들처럼 Hugging Face의 AI 에이전트도 정보의 수동적 출처가 아닌 능동적인 참여자 역할을 하는 것이 주요 목표입니다.
Browser Use와 마찬가지로 Open Computer Agent는 오픈 소스로, 누구나 그 작동 방식을 볼 수 있고, 이를 기반으로 더 발전시키거나, 니치 마케팅 같은 특정 사용 사례에 맞게 조정할 수 있습니다. 이 에이전트는 더 유연한 시작을 알리는 것이며, 법적 고지가 많은 완성된 제품은 아닙니다. 데모는 완전히 개발된 패키지가 아닌 시연용입니다. 잘못될 수도 있고, 로그인이나 CAPTCHA 테스트 시 사용자가 개입해야 할 수도 있습니다.
티켓 예약, 상점 영업 시간 확인, 검색 수행, 길 찾기, 메뉴 네비게이션 같은 작업을 자연어 프롬프트 하나로 수행할 수 있기를 원하는 사람들이 많습니다. 예를 들면, 이러저러한 작업을 위해 ChatGPT에게 가격이 저렴한 항공편을 찾으라고 하는 것과는 다릅니다. 여행 웹사이트에 접속하고, 목록을 스크롤하며, ‘지금 예약’ 버튼을 누르려 시도하는 도구를 직접 보는 경험과는 다릅니다.
Open Computer Agent는 매끄럽지 않고 그렇다고 눈에 확 띄는 것은 아니지만, 이제 유비쿼터스가 된 AI 이미지 생성기처럼 일반화될 수 있는 AI 접근 방식을 나타냅니다.
긴급 뉴스, 리뷰, 의견, 주요 기술 할인 정보 등을 받아보세요.
관심 있을 수도 있습니다.
※출처: TechRadar