AI/자연어처리(NLP)

응용 언어학 - 영어(Semantics)

반응형

응용 언어학 - 영어(Semantics)

Sentential Semantics (sentence meanings)

문맥을 중요하게 생각하는 이론

Lexical Semantics (words meanings)

단어의 의미를 중요하게 생각하는 이론

Pragmatics (discourse Meanings)

화용론

1. 언어의 의미(The Meaning of Language)

  • 우리가 아는 언어
    • 의미있고 의미없는 단어(or 문장) - 나무, 난뭄
    • 두가지 의미를 가지고 있는 단어(or 문장) - 배
    • 같은의미를 갖는 다른 단어(or 문장) - 인간, 사람
    • 반대의미를 갖는 단어(or 문장) - 살다, 죽다
    • 실제 세상에 있는지 가상의 단어인지 구분(or 문장) - 말, 유니콘
    • 문장이 참인지 거짓인지 판단
  • Semantics는 morphemes, words, phrases, and sentences의 의미를 연구하는 학문
    • Phrasal or Sentential Semantics (sentence meanings)
      문맥을 중요하게 생각하는 이론
    • Lexical Semantics (words meanings)
      단어의 의미를 중요하게 생각하는 이론

2. Sentence Semantics

  • 일반적인 맥락에서 참거짓을 판단할 수 있는 문장
  • 대부분의 문장은 맥락에의해 참거짓을 판단할 수 있다.
    • 반면에 항상 참인 문장이 있다(tautologies)
      예시
        - Circles are round.
        - A person who is single is not married
    • 문장에 모순이있어 항상 거짓인 문장이 있다(contradictions)
      예시
        - Circles are square.
        - A bachelor is married

Entailment and Related Notions

  • Entailment(함의) : 한 문장에는 함축된 의미가 있다
    예시
      Jack swims beautifully는 Jack swims라는 의미를 포함
      반대로, Jack swims는 Jack swims beautifully를 포함하지않는다
  • Paraphrases : 서로의 의미를 함축하고 있는 문장
    예시
      Jack postponed the meeting / Jack put off the meeting
  • Contradictory reations : 서로 반대되는 문장(서로의 반의어를 함의)
    예시
      Jack is alive / Jack is dead

Ambiguity

  • 한개의 문장의 한개 이상의 의미를 가지고 있는 문장을 알려준다
    • Syntactic ambiguity (구조적 중의성)
      • 한개의 문장에서 여러 의미의 구문 구조가 발생
        예시
        • The boy saw the man with the telescope
        • 뚱뚱한 사장님의 사모님이 물에 빠졌다.
    • Lexical ambiguity (어휘적 중의성)
      • 동음이의어에 의해 2가지 해석이 가능한 문장이 발생
        예시
        • This will make you smart(똑똑한, 얼얼하다)
        • 말이 빠르다

Compositional Semantics

구성성의 원리란 단어의 부분의 뜻과 그것이 어떻게 구성되느냐에 달려있다라는 의미이다.

Compositional(합성성)에서 벗어나는 경우

  • Anomaly(변칙)
    예시
    - Colorless green ideas sleep furiously.
    - 무색의 녹색 사상은 맹렬히 잔다
  • 문법적 오류는 없지만 의미상 전혀 맞지않는 문장 (해석이 되면 metaphor)
  • Metaphor(은유)
    예시
    - A grief ago(슬픈 사건 다음의 불행한 시간)
    - Wall have ears(낮말은 새가 듣고 밤말은 쥐가 듣는다)
    - 고귀한 믿을을 의심하는 행위는 자기 배반 행위이다.
  • Anomaly중의 하나로 해석이 가능한 문장 (시적허용)
  • Idioms
    • Metaphor와 다르게 이미 의미가 정해져있다
  • 첫째로 사람들은 단어 그대로의 의미로 해석을 한다
  • 이해를 못할 경우 두번째로 의미를 확장하여 해석을 한다

3. Lexical Semantics

  • Reference (지시대상)
    • 홍길동 - reference는 있지만 의미가 없음
  • Sense (의미)
    • unicorn, hobbits는 sense는 있지만 reference가 없다
  • Synonyms (동의어)
    • 같은 의미로 표현한 다른 단어
      예시
      • apathetic = indifferent
      • sofa = couch
    • 완벽하게 동일한 의미의 단어는 거의 없다(경제성의 원리)
    • 언어마다 언어의 어원이 되는 언어와 비슷한 동의어가 있따
      예시
      - 나이 vs 연령 vs 연세
      (한국어, 한자어, 한자어)
      - send vs transmit
      (English, Latin)
  • Antonyms (반의어)
    • Complementary[Simple] antonums/Binary paris(0아니면 1 완전히 반대되는 두 단어)
      예시
      - alive/dead
      - present/absent
      - awake/asleep
    • Gradable pairs[antonyms]: 절대적인 반대가 아니라 상대적인 반의어로 중간 의미가 있음
      예시
      - big / small
      - hot / cold
      - fast / slow
      - happy / sad
      - 대표로 사용된는 것을 unmarked term이라고 한다
      예시
          - "산이 얼마나 높아?"이라고 사용하지 "산이 얼마나 낮아?"로 사용하지 않는다
      
        </div>
        </details>
    • Relational antonyms : 관계형 반의어
      예시
        - give / receive
        - buy / sell
        - employer / employee
  • Lecical Relations
    • Homonyms(동철동음이의어): 소리와 철자 모두 같지만 뜻이 다른 두단어
      예시
        - bank : 은행, 둑
        - 말, 배, 사과, 은행, 화장
    • Homographs(동철이의어) : 철자는 같은 두 단어
      예시
        - bow : 인사하다, 활
        - dove : 비둘기, dive의 과거형
    • Homophones(동음이의어) : 소리만 같은 두단어
      예시
        - bear and bare : 곰, 벌거벗은
        - flower and flour : 꽃, 밀가루
    • Polysemy(다의어) : 의미가 많은 말(의미적, 역사적으로 다의어끼리 관계가 있다)
      예시
      - diamond : 지리학적 모양(the geometric shape); 야구 구장(a baseball field)
      - 가슴 : 가슴을 내밀다; 가슴을 태우다
      - 아침 : 아침이 밝아온다; 아침 먹는다
    • Hyponym and Hypernym (하의어 상의어)
    • Untitled

Linguistic database

  • WordNet
    Untitled 1
    • 💡 WordNet에는 "bass"는 8가지의 의미가 있다
    • 1.bass -(the lowest part of the musical range)
      2.bass, bass part -(the lowest part in polyphonic music)
      3.bass, basso -(an adult male singer with the lowest voice)
      4.sea bass, bass -(flesh of lean-fleshed saltwater fish of the family Serranidae)
      5.freshwater bass, bass -(any of various North American lean-fleshed freshwater
      fishes especially of the genus Micropterus)
      6.bass, bass voice, basso -(the lowest adult male singing voice)
      7.bass -(the member with the lowest range of a family of musical instruments)
      8.bass -(nontechnical name for any of numerous edible marine and
      freshwater spiny-finned fishes)
  • : A large lexical database of English words. Nouns, verbs, adjectives, and adverbs are grouped into
    sets of cognitive synonyms called ‘synsets’, each expressing a distinct concept. Synsets are
    interlinked using conceptual-semantic and lexical relations such as hyponymy
  • MindNet
    Untitled 2
  • Automatically created database of lexico-semantic relations (MS)

Semantic features

  • antonyms
    : 반의어 관계의 두 단어는 한가지 semantic feature을 제외하고 모든 것을 공유한다
    • 오타 또는 말실수는 공유된 feature가 있어서 발생하는 현상이다.
      예시
      Untitled 3

Arguments Structure

: 그 술어가 문장을 구성하면서 요구하는 논항들의 수와 그 의미역 집합을 말한다.

  • 동사에 따라서 NPs를 가질 수 있는 개수가 다르다
    예시
    - 1개도 필요 없는 동사 : sleep, sing
    - 1개의 논항을 필요로하는 동사 : 그는 물을 마신다, 그녀는 수학을 가르친다
    - 2개의 논항을 필요로하는 동사 : she teachs students math(teach는 논항이 1개 또는 2개를 필요로하는 동사-모두 가능)
  • 동사는 논항의 속성을 결정한다
    예시
    - 철수가 콜라를 마신다 (o)
    - 꽃이 물을 마신다 (x) - metaphor, idiom의 경우일 경우는 가능
    - 꽃이 화병을 마신다(x)
    • 해결 방법
      • constraints 와 subcategorization
      • collocational or Bag-of-words(같이 자주오는 단어의 조합)

Thematic Roles

: 동사와 논항의 관계를 묘사해준다.

  • Agent : 행동을 하는 사람
  • Theme : 행위의 대상
  • Goal : 위치 또는 소유의 끝지점
  • Source : 행동의 시작
  • Instrument : 행동에 필요한 도구
  • Experiencer : 행동을 겪는 대상

4. Pragmatics

  • context(문맥)에 기반한 의미를 해석하는 학문
    • Linguistic context : 앞쪽에서 설명해주는 문맥
    • Situation context : 상황, 이미 알공있는 문맥

Deixis

: (지시어, reference와 비슷하다) situation context를 의거한 지시어

  • I'll put it here
  • : I, it, here이 상황에서 의미를 알 수 있다.
  • Person deixis : I, you, she, that, man
  • Time deixis : now, then, tomorrow, yesterday
  • Place deixis : here, there,

Situational Context

  • before/behind, left/right, front/back

Pronouns and Linguistic Context

  • 이전에 Linguistic Context에 의해 대명사를 사용한다, 하지만 꼭 Pronouns(대명사)와 연결되는 것은 아니다
  • 재귀 대명사는 같은 절 안의 선행 단어를 표현한다
  • 정규 대명사(regular pronouns)는 같은 절 안의 선행 단어를 참조할 수 없다

Implicatures

: (함축) 문맥에 기초한 발언에서 도출할 수 있는 추론이다.

예시
- SUE: Does Mary have a boyfriend?
BILL: She’s been driving to Santa Barbara every weekend.
→ Mary의 남자친구는 santa barbara에 살고 있다고 추측할 수 있다.

Maxims of conversation

: 대화의 규칙

  • Maxim of Quality
  • : 진실을 말해야한다
  • Maxim of Quantity
  • : 필요한 만큼의 정보 교환이 있어야한다(많아서도 안됀다)
  • Maxim of Relation
  • : 대화의 주제와 관련있는 말을 해야한다.
  • Maxim of Manner
  • : 불분명하지 않고, 애매하지 않고, 필요없지않게 순서대로 명료하게 말을 해야한다

Reference

위 글은 데이터 청년캠퍼스 장지원 교수님의 강의를 기반으로 작성되었습니다.

반응형

'AI > 자연어처리(NLP)' 카테고리의 다른 글

응용 언어학 - 영어(Syntax)  (1) 2021.07.05
응용 언어학 - 영어(Morphology)  (1) 2021.07.05