Introducción a la programación: lenguajes de programación, nivel de abstracción de un lenguaje de programación, traducción a código máquina y errores en la programación.

Definición

Un programa es una expresión de un algoritmo en una lengua artificial formalizada (lenguaje de programación).

Definición

El Código Fuente es un conjunto de instrucciones escritas en un lenguaje de programación.

Estas se guardan en archivos de texto plano con una extensión especial (en lugar de .txt). La extensión del código fuente de C es .c y el de C++ es .cpp.

Lenguajes de programación

De forma similar a las lenguas humanas, que nos permiten comunicarnos entre nosotros; los lenguajes de programación son herramientas que nos permiten comunicarnos con los ordenadores, generalmente para describir instrucciones.

Existe una jerarquía por niveles de estos lenguajes:

Esquema de la jerarquía por niveles del los lenguajes de programación

Abajo de todo en la pirámide se encuentra el Lenguaje Máquina:

Intrucciones que puede ejecutar el hardware directamente.
Consiste en dígitos binarios que se cargan en memoria principal y que la CPU lee, descompone y ejecuta.
Cada arquitectura de CPU usa códigos distintos, por tanto, no es portable.

A continuación aparecen los Lenguajes de Programación. Se trata de un lenguaje intermedio entre el lenguaje máquina y el lenguaje natural (inglés, español…) para facilitar la creación de programas.

Ensamblador	Sustituye las instrucciones del Lenguaje Máquina por nombres fáciles de recordar (mnemónicos). Permite comentarios. Sigue dependiendo de la arquitectura de la CPU (no es portable).
Lenguajes de alto nivel	Usa palabras del inglés y notación matemática. Más fácil de entender, programar y encontrar errores. Independiente de la arquitectura (portables).

Y arriba de todo se encuentra el Lenguaje Natural, que son las lenguas humanas.

Traducción

Como ya se ha comentado, los ordenadores solo pueden ejecutar instrucciones máquina. Por tanto, ¿cómo es posible que pueden entender otros lenguajes de programación?

La traducción es el proceso en el que se transforma el código fuente de un lenguaje de programación a código máquina para que pueda ser ejecutado.

A modo de curiosidad, en este vídeo se expande un poco más sobre el proceso de traducción (e incluso cómo el Sistema Operativo carga el binario para ejecutarlo).

Compilación

Un programa llamado compilador lee el código fuente, lo traduce a instrucciones máquina y las almacena en un archivo ejecutable. Dicho archivo se podrá ejecutar múltiples veces sin que sea necesario usar el compilador.

El compilador conoce la totalidad del código fuente, por lo que puede analizarlo para añadir optimizaciones y detectar errores.

    graph LR
    src["Código fuente"]
    obj["Código objeto"]
    sbib["Bibliotecas Estáticas"]
    exe["Programa ejecutable"]
    dbib["Bibliotecas Dinámicas"]
    run(("RAM y CPU"))

    src -- compilar ---> obj
    obj -- enlazar ---> exe
    sbib ---> exe
    exe -- ejecutar ---> run
    dbib ---> run

Interpretación

Un programa llamado intérprete lee el código fuente y va ejecutando al mismo tiempo. Por tanto, cada vez que se ejecute el programa, se tendrá que usar el intérprete.

    graph LR
    src["Código fuente"]
    inst["Instrucciones"]
    run(("RAM y CPU"))

    src -- interpretar ---> inst
    inst ---> run

Bytecode

Algunos lenguajes, como por ejemplo Java, compilan el código fuente pero no a instrucciones máquina nativas, sino a bytecode: sus propias instrucciones máquina. Estas deben ser interpretadas por otro programa. Por tanto, esta solución incorpora a la vez un compilador y un intérprete.

Para poder ejecutar un programa Java, primero se debe compilar a bytecode y luego este debe ser ejecutado por la Máquina Virtual de Java (JVM). Por eso mismo, se require de tener Java instalado para poder ejecutar programas Java, pero no es necesario «tener C instalado» para ejecutar programas escritos en C.

Comparativa

Compilar	Produce ejecutables rápidos y eficientes. El ejecutable resultante no necesita software adicional.
Interpretar	Permite que el mismo código fuente se ejecute en varias plataformas sin recompilar. «Es fácil depurar lenguajes interpretados»

El proceso de compilación de C/C++

Un compilador o intérprete es un programa complicado, pero dado que el programador escribe código para pasarlo por este uno de estos, es necesario que los entienda, aunque en la mayoría de los casos no es necesario entrar en muchos detalles (está mejor explicado en el vídeo anterior).

Ya hemos comentado que primero se compila a un código objeto, luego se añaden librerías, etc, etc. Ahora nos vamos a centrar en esta primera etapa: cómo el compilador realmente entiende el código.

Esto se hace en varias fases:

Preprocesado: se eliminan los comentarios y se procesan las directivas que empiezan por # (preprocesador).
Tokenizado: se asigna a cada símbolo y elemento del código un token, para que sea más fácil de parsear.
Parseado: se construye el Abstract Syntax Tree, que es una estructura de datos que permite al compilador entender el código.
Generación de código: finalmente se genera el código máquina y se aplican optimizaciones.

Elementos básicos de un lenguaje de programación

Comentarios	Permiten documentar programas
Palabras clave (keywords)	Palabras reservadas por el lenguaje para una sintaxis determinada, y que no se pueden usar como otras cosas.
Identificadores	Nombres simbólicos para ciertos elementos (variables, funciones, tipos de datos, etc)
Expresiones	Secuencia de operadores y operandos que representa un cálculo, por ejemplo `3 + 4` o `1 + exp(x) * (1/x)`.
Constantes y Literales	Datos cuyo valor no cambian durante la ejecución del programa
Operadores	Representan operaciones entre variables y constantes.
Instrucciones	Símbolos que representan acciones de procesamiento.

Errores en la programación

Existen 3 tipos de errores en la programación:

Tipos de errores en la programación
Sintácticos	El traductor no puede entender el código fuente
Ejecución	Finalización del proceso tras intentar hacer una operación imposible
Lógicos	El programa no se detiene, pero no produce el resultado deseado.

Nótese que están por orden de dificultad.

Los errores sintácticos son muy sencillos de arreglar dado que el propio compilador o intérprete indica dónde se encuentra y porqué está mal.
Los errores de ejecución pueden no darse en todas las veces que se ejecuta, lo que complica encontrar el error.
Los errores lógicos con los más complejos, dado que son difíciles de detectar.

Introducción

[date: 05-07-2023 15:24] [last modification: 14-07-2023 14:54][words: 943] [reading time: 5min] [size: 9545 bytes]