• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.45.2013.tde-17042013-140839
Document
Author
Full name
Bruno Monte de Castro
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2013
Supervisor
Committee
Leonardi, Florencia Graciela (President)
García, Jesús Enrique
Iambartsev, Anatoli
Title in Portuguese
Seleção de modelos para segmentação de sequências simbólicas usando máxima verossimilhança penalizada
Keywords in Portuguese
consistência forte
máxima verossimilhança penalizada
Segmentação de sequências
Abstract in Portuguese
O problema de segmentação de sequências tem o objetivo de particionar uma sequência ou um conjunto delas em um número finito de segmentos distintos tão homogêneos quanto possível. Neste trabalho consideramos o problema de segmentação de um conjunto de sequências aleatórias, com valores em um alfabeto $\mathcal$ finito, em um número finito de blocos independentes. Supomos ainda que temos $m$ sequências independentes de tamanho $n$, construídas pela concatenação de $s$ segmentos de comprimento $l^{*}_j$, sendo que cada bloco é obtido a partir da distribuição $\p _j$ em $\mathcal^{l^{*}_j}, \; j=1,\cdots, s$. Além disso denotamos os verdadeiros pontos de corte pelo vetor ${{\bf k}}^{*}=(k^{*}_1,\cdots,k^{*}_)$, com $k^{*}_i=\sum _{j=1}^l^{*}_j$, $i=1,\cdots, s-1$, esses pontos representam a mudança de segmento. Propomos usar o critério da máxima verossimilhança penalizada para inferir simultaneamente o número de pontos de corte e a posição de cada um desses pontos. Também apresentamos um algoritmo para segmentação de sequências e realizamos algumas simulações para mostrar seu funcionamento e sua velocidade de convergência. Nosso principal resultado é a demonstração da consistência forte do estimador dos pontos de corte quando o $m$ tende ao infinito.
Title in English
A model selection criterion for the segmentation of symbolic sequences using penalized maximum likelihood
Keywords in English
penalized maximum likelihood
Sequence segmentation
strong consistency
Abstract in English
The sequence segmentation problem aims to partition a sequence or a set of sequences into a finite number of segments as homogeneous as possible. In this work we consider the problem of segmenting a set of random sequences with values in a finite alphabet $\mathcal$ into a finite number of independent blocks. We suppose also that we have $m$ independent sequences of length $n$, constructed by the concatenation of $s$ segments of length $l^{*}_j$ and each block is obtained from the distribution $\p _j$ over $\mathcal^{l^{*}_j}, \; j=1,\cdots, s$. Besides we denote the real cut points by the vector ${{\bf k}}^{*}=(k^{*}_1,\cdots,k^{*}_)$, with $k^{*}_i=\sum _{j=1}^l^{*}_j$, $i=1,\cdots, s-1$, these points represent the change of segment. We propose to use a penalized maximum likelihood criterion to infer simultaneously the number of cut points and the position of each one those points. We also present a algorithm to sequence segmentation and we present some simulations to show how it works and its convergence speed. Our principal result is the proof of strong consistency of this estimators when $m$ grows to infinity.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
BrunoDisser.pdf (680.17 Kbytes)
Publishing Date
2013-05-20
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.