홈 > 부모님 > 부모님 > 소설,일반 > 컴퓨터,모바일
음성 인터페이스 디자인 기본 원칙  이미지

음성 인터페이스 디자인 기본 원칙
효과적인 VUI 디자인
에이콘출판 | 부모님 | 2020.04.21
  • 정가
  • 35,000원
  • 판매가
  • 31,500원 (10% 할인)
  • S포인트
  • 1,750P (5% 적립)
  • 상세정보
  • 23.5x18.8 | 0.821Kg | 432p
  • ISBN
  • 9791161754086
  • 배송비
  • 2만원 이상 구매시 무료배송 (제주 5만원 이상) ?
    배송비 안내
    전집 구매시
    주문하신 상품의 전집이 있는 경우 무료배송입니다.(전집 구매 또는 전집 + 단품 구매 시)
    단품(단행본, DVD, 음반, 완구) 구매시
    2만원 이상 구매시 무료배송이며, 2만원 미만일 경우 2,000원의 배송비가 부과됩니다.(제주도는 5만원이상 무료배송)
    무료배송으로 표기된 상품
    무료배송으로 표기된 상품일 경우 구매금액과 무관하게 무료 배송입니다.(도서, 산간지역 및 제주도는 제외)
  • 출고일
  • 1~2일 안에 출고됩니다. (영업일 기준) ?
    출고일 안내
    출고일 이란
    출고일은 주문하신 상품이 밀크북 물류센터 또는 해당업체에서 포장을 완료하고 고객님의 배송지로 발송하는 날짜이며, 재고의 여유가 충분할 경우 단축될 수 있습니다.
    당일 출고 기준
    재고가 있는 상품에 한하여 평일 오후3시 이전에 결제를 완료하시면 당일에 출고됩니다.
    재고 미보유 상품
    영업일 기준 업체배송상품은 통상 2일, 당사 물류센터에서 발송되는 경우 통상 3일 이내 출고되며, 재고확보가 일찍되면 출고일자가 단축될 수 있습니다.
    배송일시
    택배사 영업일 기준으로 출고일로부터 1~2일 이내 받으실 수 있으며, 도서, 산간, 제주도의 경우 지역에 따라 좀 더 길어질 수 있습니다.
    묶음 배송 상품(부피가 작은 단품류)의 출고일
    상품페이지에 묶음배송으로 표기된 상품은 당사 물류센터에서 출고가 되며, 이 때 출고일이 가장 늦은 상품을 기준으로 함께 출고됩니다.
  • 주문수량
  • ★★★★★
  • 0/5
리뷰 0
리뷰쓰기

구매문의 및 도서상담은 031-944-3966(매장)으로 문의해주세요.
매장전집은 전화 혹은 매장방문만 구입 가능합니다.

  • 도서 소개
  • 출판사 리뷰
  • 작가 소개
  • 목차
  • 회원 리뷰

  도서 소개

권위 있는 음성 사용자 인터페이스(VUI) 디자인 가이드로 포괄적인 내용을 다룬다. VUI는 사용자 경험이 불만이나 만족감을 결정하는 자동 음성 인식(ASR) 시스템의 성공에 가장 중요한 요소다. 이 책은 효과적인 VUI 디자인을 만드는 실용적인 방법론을 설명한다.

이 방법론은 언어학, 심리학, 언어 기술의 원리를 과학적으로 접근한다. ASR 개발 시장 선두주자인 뉘앙스 커뮤니케이션즈의 저자들이 금융 중개업 서비스 디자인 사례를 중심으로 VUI의 디자인 원칙과 사용자의 지속적인 사용 의도를 향상시킬 수 있는 음성 에이전트 의인화 및 페르소나 전략 등을 설명한다.

  출판사 리뷰

★ 이 책의 대상 독자 ★

■ 실무자: 주요 독자는 현직 실무자나 미래의 실무자가 될 사람들이다. 초보자가 봐도 모든 자료를 이해할 수 있도록 토대를 마련하려고 노력했다. 이 책은 경험이 풍부한 디자이너와 경험이 없는 디자이너 모두에게 가치를 제공한다. 실무자들은 모든 장의 내용을 읽고 필요한 도움을 얻을 수 있을 것이다.
■ HCI(Human-Computer Interfaces) 학생: 학생들은 VUI가 다른 유형의 사용자 인터페이스와 많은 공통점이 있음을 알게 될 것이다. 반면, 다수의 문제와 디자인 접근 방식은 음성 사용자 인터페이스에서만 발견할 수 있는 고유한 것이다. 전반적으로 유용하지만 특히 1~4장, 6장, 8~13장, 15~16장에서 많은 도움을 얻을 수 있다.
■ 비즈니스 관리자: 음성 기술로 조직의 니즈를 충족할 수 있는 방법을 결정하는 이들로 1~4장과 6장에서 많은 도움을 얻을 수 있다.
■ 프로젝트 관리자: 애플리케이션을 디자인하고 배포하는 단계를 알아야 하는 이들은 1~4장, 6~8장, 14~15장, 18장에서 많은 도움을 얻을 수 있다.

★ 이 책의 구성 ★

1부, 소개: 1장부터 3장에서는 음성 사용자 인터페이스 및 디자인 문제의 개요, 기술 설명과 책 전반에 걸쳐 자세히 설명할 디자인 방법론에 대한 고차원적 관점을 포함한 입문 자료를 제공한다.
2부, 정의 단계: 4장부터 7장에서는 요구 사항을 파악하고, 상세 디자인을 하기 전에 상위 수준의 디자인 결정과 같은 프로젝트의 정의 단계를 다룬다.
3부, 디자인 단계: 8장부터 14장에서는 상세 디자인 단계를 다룬다. 디자인 원리는 실제 애플리케이션에 적용하는 방법을 많은 예제를 들어 자세히 설명한다.
4부, 실현 단계: 15장부터 18장에서는 실현 단계인 개발, 테스트, 조정을 다룬다. 문법 개발과 같은 음성 사용자 인터페이스 디자인만의 고유한 여러 가지 문제를 설명한다.
각 부는 해당 디자인 단계의 방법론적 세부 사항을 다루는 장으로 시작한다. 그다음에는 해당 단계와 관련된 디자인 원칙과 접근법을 설명하며, 각 절의 마지막 장에서는 디자인 예제를 제시한다.

  작가 소개

지은이 : 마이클 코헨
1994년 뉘앙스 커뮤니케이션즈(Nuance Communications)를 공동 설립했으며 다이얼로그 R&D 그룹의 부사장을 비롯해 다양한 직책을 맡았다. 고객과 협력해 애플리케이션 디자인과 전문 서비스 팀을 구성해 뉘앙스 초기 기술 22건을 배포하며 그룹을 이끌었다. 음성 사용자 인터페이스 연구, 세이 애니씽(Say Anything)과 아쿠루트(Accuroute)를 포함해 뉘앙스의 자연어 이해 기술과 보이저(Voyager), 뉘앙스 음성 브라우저와 같은 제품 인터페이스 디자인을 담당하는 다이얼로그 R&D 그룹을 만들었다. 70건 이상의 논문을 발표하고 음성 및 VUI 기술 관련 8건의 특허를 보유하고 있으며, 학회와 산업 무역 박람회에서 주로 발표한다. 스탠포드대학교의 컨설팅 교수로 AVIOS(Application Voice Input Society)의 이사회를 맡고 있으며, UC 버클리에서 컴퓨터 공학 박사 학위를 받았다.

지은이 : 제임스 지앤골라
운율에서부터 담화 단계까지 자연스러운 대화의 원칙을 적용하려는 '산업 언어학자'라고 자부한다. 다이얼로그 디자인 외에도 음성 합성, 연계 계획, 제작, 음성 코칭 등의 전문 기술을 지니고 있다. 최우선 관심사는 사용자에게 친숙하며 편안하고 이해하기 쉬운 언어 경험을 제공하는 것이다. 브라운대학교, 몬터레이국제학원, UC 샌디에이고에서 언어학 학위를 받았으며, 고등학교와 대학교에서 10년 동안 언어를 가르친 경험이 있다. 『The Pronunciation of Brazilian Portuguese』(LINCOM, 2001)의 저자다.

지은이 : 제니퍼 발로
뉘앙스 커뮤니케이션즈의 음성 컨설턴트다. 음성 언어 시스템의 인터페이스를 디자인하고 평가한다. AT&T, 찰스 슈왑 앤 컴퍼니(Charles Schwab & Company), TD 워터하우스와 같은 고객을 위해 애플리케이션을 연구했으며 뉘앙스 전화 운영(Nuance Call Steering), Vocalizer TTS 엔진, 음성 브라우저 보이저 및 스피치 오브젝트(SpeechObjects)를 비롯한 여러 제품에 기여했다. 컴퓨터 시스템의 인적 요인에 관한 CHI 콘퍼런스와 인간 문장 처리에 관한 CUNY 콘퍼런스에서 발표를 했으며, 스탠포드대학교, UC 샌디에이고, 샌프란시스코대학교, 샌디에이고대학교에서도 강의했다. 「Brain and Language」와 「International Journal of Speech Technology」 등에서 여러 논문을 발표했다. UC 샌디에이고에서 심리학 박사 학위를 받았고 브랜다이스대학교에서 학사 학위를 받았다.

  목차

1부. 소개

1장. 음성 사용자 인터페이스 소개

1.1 음성 사용자 인터페이스란?
1.1.1 청각 인터페이스
1.1.2 대화 인터페이스
1.2 왜 음성인가?
1.3 앞으로 어떻게 해야 하는가?


2장. 음성 언어 기술 개요

2.1 음성 언어 시스템의 구조
2.1.1 음성 언어 시스템의 요소
2.1.2 인식
2.1.3 다른 음성 기술
2.2 음성 기술이 디자인 결정에 미치는 영향
2.2.1 성능 문제
2.2.2 문제 해결
2.2.3 정의 파일
2.3 결론


3장. 방법론 개요

3.1 방법론적 원칙
3.1.1 최종 사용자 입력
3.1.2 통합 비즈니스와 사용자 니즈
3.1.3 철저한 초기 작업
3.1.4 대화 디자인
3.1.5 맥락
3.2 방법론의 단계
3.2.1 요구 사항 정의
3.2.2 상위 디자인
3.2.3 상세 디자인
3.2.4 개발
3.2.5 테스트
3.2.6 튜닝
3.3 실제 애플리케이션에 방법론 적용
3.3.1 단계 조정
3.3.2 실제 예산과 시간 제약 처리
3.4 결론


2부. 정의 단계: 요구 사항 수집과 상위 디자인

4장. 요구 사항과 상위 디자인 방법론

4.1 요구 사항 정의
4.1.1 비즈니스 이해
4.1.2 사용자 이해
4.1.3 애플리케이션 이해
4.2 상위 디자인
4.2.1 주요 디자인 기준
4.2.2 다이얼로그 전략과 문법 유형
4.2.3 보편적인 다이얼로그 요소
4.2.4 반복 용어
4.2.5 메타포
4.2.6 페르소나
4.2.7 비언어 오디오
4.3 결론


5장. 상위 디자인 요소

5.1 다이얼로그 전략과 문법 유형
5.2 보편적인 다이얼로그 요소
5.2.1 오류 복구 전략
5.2.2 보편성
5.2.3 로그인
5.3 결론


6장. 계획적으로 페르소나 만들기

6.1 페르소나란 무엇인가?
6.2 페르소나는 어디에서 오는가?
6.3 페르소나 디자인 체크리스트
6.3.1 메타포와 역할
6.3.2 브랜드와 이미지
6.3.3 최종 사용자
6.3.4 애플리케이션
6.4 페르소나 정의
6.5 결론


7장. 샘플 애플리케이션: 요구 사항과 상위 디자인

7.1 렉싱턴 증권사
7.2 요구 사항 정의
7.2.1 비즈니스 목표와 맥락 이해
7.2.2 호출자 이해
7.2.3 애플리케이션 이해
7.3 상위 디자인
7.3.1 주요 디자인 기준
7.3.2 다이얼로그 전략과 문법 형식
7.3.3 보편적인 다이얼로그 요소
7.3.4 반복 용어
7.3.5 메타포
7.3.6 페르소나
7.3.7 비언어적인 오디오
7.4 결론


3부. 디자인 단계: 상세 디자인

8장. 상세 디자인 방법론

8.1 다이얼로그 상태 분석
8.2 호출 흐름 디자인
8.3 프롬프트 디자인
8.3.1 대화형 디자인
8.3.2 청각 디자인
8.4 사용자 테스트
8.4.1 형식적인 사용성 테스트
8.4.2 카드 분류
8.5 디자인 원칙
8.6 결론


9장. 인지 부하 최소화

9.1 개념의 복잡성
9.1.1 불변성
9.1.2 일관성
9.1.3 맥락 설정
9.2 기억 부하
9.2.1 메뉴 크기
9.2.2 최신
9.2.3 지시 사항
9.3 주의
9.4 결론


10장. 계획적인 프롬프트

10.1 담화로서의 대화
10.2 응집력
10.2.1 대명사와 시간 부사
10.2.2 담화 표지
10.3 정보 구조
10.4 구어체 영어 대 문어체 영어
10.4.1 포인터 단어
10.4.2 축약
10.4.3 'must'와 'may'
10.4.4 'Will'과 'Going To'
10.4.5 "Romans Perspire, Anglo-Saxons Sweat"(로마인은 땀을 흘리고,
앵글로색슨족은 땀을 흘린다)
10.5 용어 및 일관성
10.6 은어
10.7 공동 원칙
10.8 결론


11장. 운율 체계 계획하기

11.1 운율이란?
11.2 운율의 기능
11.3 강세
11.4 억양
11.4.1 기본 억양 음조 곡선
11.4.2 맥락의 음조 곡선
11.5 전화번호 연결
11.5.1 전화번호의 운율 구조
11.5.2 숫자별 연결
11.6 연결 접합 최소화
11.7 멈춤
11.8 TTS 가이드라인
11.8.1 애플리케이션 사용 분석
11.8.2 적절한 음성 선택
11.8.3 가능하면 오디오 녹음 사용
11.8.4 이해하기 쉬운 콘텐츠 만들기
11.8.5 적절한 형식 사용
11.8.6 자연스러움을 위한 문자 마크업
11.9 결론


12장. 효율성과 명확성의 극대화

12.1 효율성
12.1.1 작업 손실 방지
12.1.2 빈번한 작업을 효율적으로 수행
12.1.3 바로가기 제공
12.1.4 호출자 모델링을 사용해 단계 저장
12.2 명확성
12.2.1 자연 언어 이해를 위한 멘탈 모델
12.2.2 표식을 통한 탐색 명확성
12.3 효율성 및 명확성 균형 조정
12.3.1 개별 프롬프트에서 강세 명확성
12.3.2 단계적인 프롬프트
12.3.3 끼어들기 사용
12.4 결론


13장. 정확성 최적화와 오류 복구

13.1 정확성 측정
13.2 정확성 극대화를 위한 다이얼로그 디자인 가이드라인
13.3 오류 복구
13.3.1 확인 전략
13.3.2 거부 및 시간 초과로부터 복구
13.4 결론


14장. 샘플 애플리케이션: 상세 디자인

14.1 호출 흐름 디자인
14.1.1 로그인 서브 다이얼로그
14.1.2 견적 서브 다이얼로그
14.1.3 거래 서브 다이얼로그
14.2 프롬프트 디자인
14.3 사용자 테스트
14.4 결론


4부. 구현 단계: 개발, 테스트, 튜닝

15장. 개발, 테스트, 튜닝 방법론

15.1 개발
15.1.1 애플리케이션 개발
15.1.2 문법 개발
15.1.3 오디오 제작
15.2 테스트
15.2.1 애플리케이션 테스트
15.2.2 인식 테스트
15.2.3 평가용 사용성 테스트
15.3 튜닝
15.3.1 다이얼로그 튜닝
15.3.2 인식 튜닝
15.4 결론


16장. 문법 작성

16.1 문법 개발
16.1.1 규칙 기반 문법 개발
16.1.2 통계 언어 모델을 위한 문법 개발
16.1.3 탄탄한 자연어 문법 개발
16.1.4 통계적 자연어 문법 개발
16.2 문법 테스트
16.2.1 규칙 기반 문법 테스트
16.2.2 통계 언어 모델 테스트
16.2.3 탄탄한 자연어 문법 테스트
16.2.4 통계적 자연어 문법 테스트
16.3 문법 튜닝
16.3.1 튜닝 규칙 기반 문법
16.3.2 통계 언어 모델 튜닝
16.3.3 탄탄한 자연어 문법 튜닝
16.3.4 통계적 자연어 문법 튜닝
16.4 결론


17장. 성우와 함께 작업하기

17.1 성공을 위한 스크립트
17.1.1 도입 사례 연구
17.1.2 스크립트 팁
17.2 성우 선택
17.2.1 전문성 및 경험
17.2.2 코치 능력
17.2.3 페르소나에 맞추기
17.2.4 데모 테이프(또는 CD)와 오디션
17.3 녹음 세션 실행
17.3.1 절차상 고려 사항
17.3.2 음성 코치하기
17.4 결론


18장. 샘플 애플리케이션: 개발, 테스트, 튜닝

18.1 개발
18.1.1 애플리케이션 개발
18.1.2 문법 개발
18.1.3 오디오 제작
18.2 테스트
18.2.1 평가용 사용성 테스트
18.3 튜닝
18.3.1 다이얼로그 튜닝
18.3.2 인식 튜닝
18.3.3 문법 튜닝
18.3.4 사용자 설문 조사


19장. 결론


부록

  회원리뷰

리뷰쓰기

    이 분야의 신상품