Skip to content

Mini-Babel Library

Reinforcement Learning

Initializing search

Mini-Babel Library

🏛️ Mini-Babel Library
Docs
Docs
- 1 cs
  1 cs
  - 💻 Computer Science Notes
  - x86汇编
  - C大程 libgraphics 文档使用记录
  - Algorithm
    Algorithm
    
    Algorithm
    
    Backtracking 回溯
    
    Divide and Conquer 分治
    
    Dynamic Programming 动态规划
    
    Greedy 贪心
  - Architecture
    Architecture
    
    索引
    
    chap2: Memory Hierachy Design
    
    chap3: Instruction-level Parallelism (ILP)
    
    chap5: Thread-level Parallelism
  - Compiler
    Compiler
    
    Compiler
    
    Parsing
  - Database
    Database
    
    DBMS
    
    Database Design 数据库设计
    
    E-R model
    
    数据库关系模式
    
    Query Process 查询处理
    
    SQL Grammar
    
    Transaction 事务
    
    XML 文件
  - Oop
    Oop
    
    Courses 听课
    
    ZJU 期末复习
    
    模板Template 和标准模板库STL
  - Os
    Os
    
    索引
    
    OS lab
- 2 ling
  2 ling
  - 🌳 Linguistic Notes
  - Acqusition
    Acqusition
    
    Language Acqusition
    
    French Conjugaison
    
    French Tense summarization
  - Morphology
    Morphology
    
    Morphology
  - Philosophy
    Philosophy
    
    Philosophy of Language 语言哲学
    
    TODO
    
    Philosophy of Language 语言哲学
    
    Reading Notes of Cours de linguistique générale, Ferdinand de Saussure
  - Pragmatics
    Pragmatics
    
    Research Methods: Conversation Analysis and Discourse Analysis
    
    Introduction and Concepts
    
    Sociopragmatics
    
    Theories and Hypothesis
  - Semantics
    Semantics
    
    Index
    
    Ambiguity
    
    Definition Clarification
    
    Logics & Formal Semantics
  - Syntax
    Syntax
    
    Syntax
    
    Transformational Generative Grammar 转换生成句法
    
    依存句法 UD & SUD
    
    普遍语法 Universal Grammar
- 3 dl
  3 dl
  - 🤖 Deep Learning
  - Basics
    Basics
    
    Language Model Basics
    
    Byte pair encoding (BPE)
    
    ELMo
  - Efficient train
    Efficient train
    
    Efficient Training
    
    Hardware
    
    Parameter
  - Formal language
    Formal language
    
    Introduction to Formal Languages
    
    CYK Algorithm
    
    Lectures
  - Rl
    Rl
    
    Reinforcement Learning Reinforcement Learning
    Table of contents
    
    Contents
    
    Convergence Property
    
    Markov Process
  - Survey
    Survey
    
    Misc Survey
    
    Explainable NLP Survey
    
    Llama-3.1-405B 技术报告
    
    Math Word Problem Survey
    
    Multilingual Task Survey
  - Tools
    Tools
    
    Tools
    
    Codabench 比赛创建教程
    
    Pythons' Code Style Guide
    
    DL & NLP Resources
- 4 opinion
  4 opinion
- 5 life
  5 life
  - 🎹 C'est la vie
  - Portfolio
  - Annual summary
    Annual summary
    
    Annual Summary 年度总结
    
    2024
  - Read watch listen
    Read watch listen
    
    Read, Watch, Listen 书影音
    
    乐理
    
    Musicals

Table of contents

Contents

Reinforcement Learning

:material-circle-edit-outline: 约 9 个字

CS 885

Contents

Markov Process
Convergence Properties

Made with Material for MkDocs