Swift de Cero a Experto #3: Strings y Characters

En el artículo anterior descubrimos que las colecciones son value types con su contenido en el heap y la magia de copy-on-write. Hoy vamos a explorar un tipo que parece simple pero esconde una de las decisiones de diseño más valientes de Swift: el String.

¿Por qué no puedes escribir myString[0]? ¿Por qué contar caracteres es O(n)? ¿Y qué tiene que ver un emoji con banderas con todo esto? La respuesta a todas estas preguntas es la misma: Unicode.

Swift eligió correctitud sobre conveniencia. Y esa decisión cambió todo lo que sabes sobre strings.

El ave Swift explicando Unicode al capibara con caracteres flotando

String Literals: creando texto

La forma más directa de crear un string es con un literal:

let greeting = "Hello, world"

Swift infiere el tipo String automáticamente. Pero los literals pueden ser más sofisticados de lo que parece.

Multiline strings

let poem = """
    Roses are red,
    Violets are blue,
    Swift is amazing,
    And so are you.
    """

La indentación se controla con la posición de las """ de cierre — cualquier espacio antes de esa línea se ignora en todas las líneas.

Caracteres especiales

let wiseWords = "\"Imagination is more important than knowledge\" - Einstein"
let dollarSign = "\u{24}"        // $  — Unicode scalar U+0024
let blackHeart = "\u{2665}"      // ♥  — Unicode scalar U+2665
let sparklingHeart = "\u{1F496}" // 💖 — Unicode scalar U+1F496

Extended delimiters

// El \n se imprime literalmente, no como salto de línea
let raw = #"Line 1\nLine 2"#

// Si necesitas interpolación dentro de extended delimiters:
let value = 42
let message = #"The answer is \#(value)"#
// "The answer is 42"

Los extended delimiters (#"..."#) son perfectos cuando tu string contiene muchas comillas o backslashes — como expresiones regulares o JSON.

String es un value type

Algo que vale la pena repetir: String es un struct en Swift. Es un value type, como Int o Array. Y al igual que Array, usa copy-on-write — el buffer de caracteres vive en el heap, pero solo se copia cuando mutas.

var original = "Hello"
var copy = original      // Comparten el mismo buffer (CoW)
copy += ", world"        // Ahora copy tiene su propio buffer
// original sigue siendo "Hello"

Characters: no son lo que piensas

Aquí es donde Swift se separa de la mayoría de los lenguajes. Un Character en Swift no es un byte, ni un code point, ni un char de C. Es un extended grapheme cluster — la unidad mínima que un ser humano percibe como “un carácter”.

for character in "Dog!🐶" {
    print(character)
}
// D
// o
// g
// !
// 🐶

Hasta aquí parece normal. Pero mira esto:

let eAcute: Character = "\u{E9}"                // é — un scalar
let combinedEAcute: Character = "\u{65}\u{301}"  // e + ◌́ — dos scalars
// Ambos son é, ambos son UN solo Character

El carácter é puede representarse de dos formas en Unicode: como un único scalar (U+00E9) o como dos scalars combinados (e + acento). Swift los trata como el mismo Character, porque visualmente y lingüísticamente son idénticos.

El capibara sorprendido al ver que é puede estar compuesto de uno o dos scalars

Esto se pone más interesante con emojis

let flag: Character = "\u{1F1FA}\u{1F1F8}"  // 🇺🇸
// Dos scalars → un Character

Una bandera de país es un solo Character compuesto por dos Unicode scalars (Regional Indicator Symbols). Y aún hay más:

let family = "👨‍👩‍👧‍👦"
print(family.count) // 1
// ¡Un solo Character compuesto por 7 Unicode scalars!
// 👨 + ZWJ + 👩 + ZWJ + 👧 + ZWJ + 👦
// ZWJ (Zero-Width Joiner) es un Unicode scalar invisible (U+200D)
// que le dice al motor de texto que fusione los emojis vecinos en un solo glifo.

Diagrama que muestra el emoji de familia como una cadena de 7 Unicode scalars (👨 U+1F468, ZWJ U+200D, 👩 U+1F469, ZWJ, 👧 U+1F467, ZWJ, 👦 U+1F466) que colapsa en una única caja Character donde family.count es igual a 1

¿Por qué no existe `string[0]`?

En C, char *name = "hello"; name[2] funciona porque cada char ocupa exactamente 1 byte. Saltar al tercer byte es una operación O(1) — solo sumas 2 a la dirección de memoria.

En Swift, eso es imposible. El carácter é puede ocupar 2 bytes o 4 bytes dependiendo de cómo esté codificado. Un emoji de familia puede ocupar 25 bytes. Para saber dónde empieza el tercer Character, Swift tiene que recorrer los dos anteriores y contar sus bytes.

Por eso Swift usa String.Index en lugar de enteros:

let greeting = "Guten Tag!"

greeting[greeting.startIndex]                          // G
greeting[greeting.index(after: greeting.startIndex)]   // u
greeting[greeting.index(greeting.startIndex, offsetBy: 7)] // a
greeting[greeting.index(before: greeting.endIndex)]    // !

Métodos de String.Index

startIndex → posición del primer Character
endIndex → posición después del último Character
index(after:) → siguiente posición
index(before:) → posición anterior
index(_:offsetBy:) → avanzar/retroceder N posiciones

Iterando sobre índices

for index in greeting.indices {
    print("\(greeting[index]) ", terminator: "")
}
// G u t e n   T a g !

Contando caracteres: O(n) por diseño

let zoo = "Koala 🐨, Snail 🐌, Penguin 🐧, Dromedary 🐪"
print(zoo.count) // 40

.count es O(n) — Swift tiene que recorrer todo el string para contar los extended grapheme clusters. Esto es una consecuencia directa de que los Characters tienen tamaño variable.

Y hay un caso que lo demuestra perfectamente:

var word = "cafe"
print(word.count) // 4

word += "\u{301}" // Agrega COMBINING ACUTE ACCENT

print(word)       // "café"
print(word.count) // 4 — ¡sigue siendo 4!

Agregar un combining accent no agrega un Character — modifica el último. La e y el acento se fusionan en é, un solo extended grapheme cluster.

En Swift, el número de caracteres de un string no es el número de bytes, ni el número de code points. Es el número de unidades que un humano percibiría como “letras”. Y eso requiere recorrer todo el string.

Modificando strings

Insertar y eliminar

var welcome = "hello"
welcome.insert("!", at: welcome.endIndex)
// "hello!"

welcome.insert(contentsOf: " there", at: welcome.index(before: welcome.endIndex))
// "hello there!"

welcome.remove(at: welcome.index(before: welcome.endIndex))
// "hello there"

let range = welcome.index(welcome.endIndex, offsetBy: -6)..<welcome.endIndex
welcome.removeSubrange(range)
// "hello"

Concatenación

let start = "hello"
let end = " there"
var combined = start + end  // "hello there"

combined += "!"             // "hello there!"

let exclamation: Character = "!"
combined.append(exclamation)

Interpolación

let multiplier = 3
let message = "\(multiplier) times 2.5 is \(Double(multiplier) * 2.5)"
// "3 times 2.5 is 7.5"

La interpolación de strings es type-safe — el compilador verifica que la expresión dentro de \() sea válida. No hay format strings peligrosos como printf en C.

Substrings: compartir para no copiar

Cuando obtienes una porción de un string — con un subscript, prefix(_:), o suffix(_:) — Swift no te da un String. Te da un Substring.

let greeting = "Hello, world!"
let index = greeting.firstIndex(of: ",") ?? greeting.endIndex
let beginning = greeting[..<index] // "Hello" — tipo Substring

// Para almacenar a largo plazo, convierte a String
let stored = String(beginning)

¿Por qué? Memoria. Un Substring comparte el buffer del String original. No se copia nada. Es instantáneo.

Diagrama técnico mostrando cómo Substring comparte el buffer del String original

Cuidado con retener Substrings

Si mantienes un Substring en memoria, el String original completo no puede liberarse — porque el Substring apunta a su buffer. Si tienes un string de 1 MB y solo necesitas los primeros 5 caracteres, convierte a String para liberar el buffer original:

let huge = String(repeating: "x", count: 1_000_000)
let tiny = String(huge.prefix(5)) // Copia solo 5 chars, libera el resto

Comparando strings

let quote = "We're a lot alike, you and I."
let sameQuote = "We're a lot alike, you and I."
quote == sameQuote // true

La comparación en Swift usa equivalencia canónica: dos strings son iguales si representan el mismo texto, aunque estén compuestos por diferentes Unicode scalars:

let eAcuteQuestion = "Voulez-vous un caf\u{E9}?"         // é como un scalar
let combinedQuestion = "Voulez-vous un caf\u{65}\u{301}?" // e + ◌́

eAcuteQuestion == combinedQuestion // true — misma representación visual

También tienes búsqueda de prefijos y sufijos:

let filename = "report-2026-Q1.pdf"
filename.hasPrefix("report")  // true
filename.hasSuffix(".pdf")    // true

Representaciones Unicode

Un mismo string puede verse de formas diferentes dependiendo de la codificación:

let dogString = "Dog‼🐶"

// UTF-8 — bytes de 8 bits
for byte in dogString.utf8 {
    print("\(byte) ", terminator: "")
}
// 68 111 103 226 128 188 240 159 144 182

// UTF-16 — code units de 16 bits
for unit in dogString.utf16 {
    print("\(unit) ", terminator: "")
}
// 68 111 103 8252 55357 56374

// Unicode Scalars — valores de 21 bits
for scalar in dogString.unicodeScalars {
    print("\(scalar.value) ", terminator: "")
}
// 68 111 103 8252 128054

Diagrama que alinea el string "Dog‼🐶" contra sus tres codificaciones en filas paralelas: bytes UTF-8 (10 en total), code units UTF-16 (6 en total) y valores de Unicode scalar (5 en total), mostrando cómo los caracteres más anchos se expanden en más code units

¿Cuándo usar cada representación?

.utf8 → Interoperabilidad con C, networking, archivos
.utf16 → Interoperabilidad con Foundation/NSString
.unicodeScalars → Procesamiento Unicode de bajo nivel
.count (Characters) → Lo que el usuario ve y espera

La memoria detrás de String

Todo lo que hemos visto tiene implicaciones directas en cómo Swift gestiona los strings en memoria.

Small String Optimization

Para strings cortos (15 bytes o menos en plataformas de 64 bits), Swift almacena los caracteres directamente en el struct, sin ir al heap. Esto elimina la alocación dinámica para la mayoría de strings comunes — nombres de variables, códigos de país, etiquetas cortas.

let short = "Hello"      // 5 bytes — cabe inline, no hay heap allocation
let long = String(repeating: "x", count: 100) // 100 bytes — va al heap

Diagrama que compara dos valores String: a la izquierda "Hello" (5 bytes) almacenado inline dentro del struct de 16 bytes sin flecha al heap, a la derecha un string de 100 bytes cuyo struct guarda un pointer a un buffer en el heap

El costo de cada operación

Complejidad de String

count → O(n) — recorre todos los grapheme clusters
startIndex, endIndex → O(1)
index(after:) → O(1) por grapheme cluster
index(_:offsetBy: k) → O(k) — recorre k positions
Acceso por índice string[i] → O(1) si ya tienes el índice
hasPrefix, hasSuffix → O(n) del prefijo/sufijo
== → O(n) — debe verificar equivalencia canónica
Concatenación + → O(n) — copia ambos buffers

Tip de rendimiento

Si necesitas acceso posicional frecuente a caracteres, considera convertir el string a un Array<Character> primero. El array te da acceso O(1) por índice a cambio de una copia O(n) inicial y más memoria.

let text = "Hello, world!"
let chars = Array(text) // O(n) una vez
chars[7]                // O(1) siempre — "w"

Recapitulación

Hoy descubrimos por qué String en Swift es mucho más que “texto”:

String Literals — simples, multiline, extended delimiters, interpolación type-safe
Value Type con CoW — struct value-type; buffer de caracteres en el heap (a menos que el string sea lo bastante corto para Small String Optimization — entonces los bytes viven inline en el struct), copy-on-write
Characters = Extended Grapheme Clusters — lo que un humano percibe, no bytes
String.Index — por qué string[0] no existe y cómo navegar correctamente
count es O(n) — consecuencia directa de Characters de tamaño variable
Substring — comparte el buffer del original para evitar copias
Equivalencia canónica — é == e + ◌́ en comparaciones
Small String Optimization — strings cortos evitan el heap
UTF-8, UTF-16, Unicode Scalars — tres formas de ver el mismo texto

Swift tomó la decisión difícil con los strings: ser correcto siempre, aunque eso signifique que string[0] no exista. Esa misma filosofía — correctitud sobre conveniencia — es lo que hace al lenguaje excepcional.

Lo que viene

En el próximo artículo exploramos el control de flujo: if/else, switch con pattern matching exhaustivo, guard como filosofía de early exit, y cómo el compilador convierte tus switches en jump tables eficientes. Vamos a ver cómo las decisiones que tomas en cada if y switch le hablan directamente al compilador.

Nos vemos la próxima semana.

Entender cómo Swift maneja texto es entender sus valores como lenguaje: correctitud primero, rendimiento después — y al final, consigues ambos.

Swift de Cero a Experto #3: Strings y Characters — mucho más que texto

String Literals: creando texto

Multiline strings

Caracteres especiales

Extended delimiters

String es un value type

Characters: no son lo que piensas

Esto se pone más interesante con emojis

¿Por qué no existe `string[0]`?

Iterando sobre índices

Contando caracteres: O(n) por diseño

Modificando strings

Insertar y eliminar

Concatenación

Interpolación

Substrings: compartir para no copiar

Comparando strings

Representaciones Unicode

La memoria detrás de String

Small String Optimization

El costo de cada operación

Recapitulación

Lo que viene

Relacionados

Swift de Cero a Experto #9: Propiedades, métodos y subscripts

Swift de Cero a Experto #8: Structs vs Classes — la decisión que define tu app

Swift de Cero a Experto #7: Enumeraciones — más que una lista de casos

String Literals: creando texto

Multiline strings

Caracteres especiales

Extended delimiters

String es un value type

Characters: no son lo que piensas

Esto se pone más interesante con emojis

¿Por qué no existe string[0]?

Iterando sobre índices

Contando caracteres: O(n) por diseño

Modificando strings

Insertar y eliminar

Concatenación

Interpolación

Substrings: compartir para no copiar

Comparando strings

Representaciones Unicode

La memoria detrás de String

Small String Optimization

El costo de cada operación

Recapitulación

Lo que viene

Relacionados

Swift de Cero a Experto #9: Propiedades, métodos y subscripts

Swift de Cero a Experto #8: Structs vs Classes — la decisión que define tu app

Swift de Cero a Experto #7: Enumeraciones — más que una lista de casos

¿Por qué no existe `string[0]`?