Python 및 Vision API를 사용하여 이미지에서 프로그래밍 방식으로 라벨을 추출하려면 Google Cloud Vision API의 강력한 기능을 활용할 수 있습니다. Vision API는 이미지에서 라벨을 자동으로 식별하고 추출할 수 있는 라벨 감지를 포함한 포괄적인 이미지 분석 기능 세트를 제공합니다.
시작하려면 Google Cloud 프로젝트를 설정하고 Vision API를 사용 설정해야 합니다. 이 작업을 완료하면 다음 명령을 실행하여 필요한 Python 라이브러리를 설치할 수 있습니다.
python pip install google-cloud-vision
다음으로 Vision API에 액세스하려면 애플리케이션을 인증해야 합니다. 서비스 계정 키를 만들고 `GOOGLE_APPLICATION_CREDENTIALS` 환경 변수가 키 파일의 경로를 가리키도록 설정하면 됩니다. 이는 다음 코드를 사용하여 수행할 수 있습니다.
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
이제 Vision API를 사용하여 이미지에서 프로그래밍 방식으로 라벨을 추출할 수 있습니다. 다음 코드 조각은 이를 수행하는 방법을 보여줍니다.
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
이 코드에서는 먼저 `google.cloud.vision` 라이브러리에서 `ImageAnnotatorClient` 클래스의 인스턴스를 만듭니다. 그런 다음 이미지 파일을 읽고, 파일 콘텐츠에서 `Image` 객체를 생성하고, 라벨 감지를 위해 Vision API로 보냅니다. API 응답에는 라벨 설명을 추출하는 라벨 주석 목록이 포함되어 있습니다.
이제 분석하려는 이미지 파일의 경로를 전달하여 `extract_labels` 함수를 호출할 수 있습니다. 이미지에서 추출된 라벨 목록이 반환됩니다.
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
그러면 이미지에서 추출된 라벨이 출력됩니다.
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
Vision API는 고급 기계 학습 모델을 사용하여 이미지를 분석하고 개체, 장면 및 기타 시각적 특징을 식별합니다. 광범위한 레이블을 정확하게 감지할 수 있으므로 이미지 분류, 콘텐츠 조정 및 시각적 검색과 같은 다양한 애플리케이션에 유용한 도구입니다.
Python 및 Vision API를 사용하여 프로그래밍 방식으로 이미지에서 라벨을 추출하려면 Google Cloud 프로젝트를 설정하고, Vision API를 사용 설정하고, 필수 Python 라이브러리를 설치하고, 애플리케이션을 인증한 다음 Vision API를 사용하여 이미지에서 라벨 감지를 수행해야 합니다. 이미지. 추출된 레이블은 추가 분석이나 이미지 내용에 대한 이해를 높이는 데 사용될 수 있습니다.
기타 최근 질문 및 답변 EITC/AI/GVAPI Google Vision API:
- 이미지가 아닌 비디오에서 Pillow Python 라이브러리를 사용하여 객체를 감지하고 라벨링하는 데 Google Vision API를 적용할 수 있나요?
- 이미지와 비디오에서 동물 주위에 개체 테두리 그리기를 구현하고 이러한 테두리에 특정 동물 이름을 지정하는 방법은 무엇입니까?
- Google Vision API의 객체 인식을 위해 사전 정의된 카테고리에는 어떤 것이 있나요?
- Google Vision API는 얼굴 인식을 지원하나요?
- "draw_vertices" 함수를 사용하여 객체 테두리를 그릴 때 표시 텍스트를 이미지에 어떻게 추가할 수 있나요?
- 제공된 코드에서 "draw.line" 메소드의 매개변수는 무엇이며 정점 값 사이에 선을 그리는 데 이 매개변수가 어떻게 사용됩니까?
- Python에서 객체 테두리를 그리는 데 필로우 라이브러리를 어떻게 사용할 수 있습니까?
- 제공된 코드에서 "draw_vertices" 함수의 목적은 무엇입니까?
- Google Vision API는 이미지의 모양과 개체를 이해하는 데 어떻게 도움이 되나요?
- 사용자는 API에서 권장하는 시각적으로 유사한 이미지를 어떻게 탐색할 수 있나요?
EITC/AI/GVAPI Google Vision API에서 더 많은 질문과 답변 보기
더 많은 질문과 답변:
- 들: 인공 지능
- 프로그램 : EITC/AI/GVAPI Google Vision API (인증 프로그램으로 이동)
- 교훈: 이미지 라벨링 (관련 강의 바로가기)
- 주제 : 라벨 감지 (관련 항목으로 이동)
- 심사 검토