domingo, 23 de septiembre de 2007

[Artículo] Linux (núcleo)




Linux es el núcleo o kernel del sistema operativo libre denominado GNU/Linux (también llamado Linux). Lanzado bajo la licencia pública general (GPL - General Public License) de GNU y desarrollado gracias a las contribuciones de todo el mundo, Linux es uno de los mejores ejemplos de software open source cuyos desarrolladores originales siguieron la filosofía del movimiento open source.

Linux fue creado por Linus Torvalds en 1991. Muy pronto, la comunidad de Minix (un clon del sistema operativo Unix) contribuyó en el código y en ideas para el kernel de Linux. Por aquel entonces, el Proyecto GNU había creado muchos de los componentes necesarios para un sistema operativo libre, pero su propio kernel, GNU Hurd, era incompleto y por lo tanto no estaba disponible. Es por esto que a pesar de las funcionalidades limitadas de la primera versión, rápidamente Linux fue acumulando desarrolladores y usuarios que adoptaron el código de estos proyectos para usar con el nuevo sistema operativo. Hoy en día el kernel de Linux ha recibido contribuciones de miles de programadores.

Historia

En abril de 1991, Linus Torvalds de 21 años, empezó a trabajar en unas simples ideas para un sistema operativo. Comenzó con un intento por obtener un sistema operativo libre similar a Unix que funcionara con microprocesadores Intel 80386. Luego, el 25 de agosto de 1991, Torvalds escribió en el newsgroups comp.os.minix[2]:

"Estoy haciendo un sistema operativo (gratuito, sólo un hobby, no será nada grande ni profesional como GNU) para clones AT 386(486). Esto ha sido desde abril y está empezando a estar listo. Me gustaría un feedback de las cosas que les gustan o disgustan en minix. Actualmente he portado bash(1.08) y gcc(1.40), y parece que las cosas funcionan. Esto implica que tendré algo práctico en unos meses..."

Luego de esto, muchas personas contribuyeron con el código. Para septiembre de 1991, se lanzó la versión 0.01 de Linux. Tenía 10.239 líneas de código. En octubre de ese año, se lanzó la versión 0.02 de Linux, luego en diciembre se lanzó la versión 0.11. Esta versión fue la primera en ser self-hosted. Linux 0.11 podía ser compilado por una computadora que corriera Linux 0.11. Cuando lanzó la siguiente versión, Torvalds adoptó GNU GPL como su propio boceto de licencia, el cual no permitía su redistribución comercial.

Se comenzó un newsgroup llamado alt.os.linux y el 19 de enero de 1992 se realizó el primer post en alt.os.linux. El 31 de marzo, alt.os.linux se convirtió en comp.os.linux. Rápidamente el X Window System fue implementado en Linux y en marzo la versión 0.95 de Linux fue la primera en ser capaz de correr X. Este gran salto de versiones (de 0.1x a 0.9x) fue por la sensación de que una versión 1.0 sin piezas faltantes no estaba lejos. Sin embargo, esto fue un poco optimista: desde 1993 a principios de 1994, se desarrollaron 15 versiones diferentes de 0.99.

El 14 de marzo de 1994, se lanzó Linux 1.0.0 con 176.250 líneas de código. En marzo de 1995 se lanzó Linux 1.2.0 con 310.950 líneas de código.

Ya en mayo de 1996 Linus decidió adoptar al pingüino Tux como mascota para Linux.

La versión 2 de Linux se lanzó el 9 de junio de 1996 y fue un gran éxito. A este le siguieron grandes desarrollos:

* 25 de enero de 1999: se lanzó Linux 2.2.0 con 1.800.847 líneas de código.
* 18 de diciembre de 1999: se publicaron parches de IBM Mainframe para 2.2.13, permitiendo de esta forma que Linux fuera usado en máquinas corporativas.
* 4 de enero de 2001: se lanzó Linux 2.4.0 con 3.377.902 líneas de código.
* 17 de diciembre de 2003: se lanzó Linux 2.6.0 con 5.929.913 líneas de código.


Aspectos técnicos

Linux admite real preemptive multitasking (ambos en modo de usuario y modo de kernel), memoria virtual, librerías compartidas, demand loading, shares copy-on-write executables, memory management, the Internet protocol suite y threading.

Arquitectura

Hoy por hoy, Linux es un núcleo monolítico híbrido. Los controladores de dispositivos y las extensiones del núcleo normalmente se ejecutan en un espacio privilegiado conocido como anillo 0 (ring 0), con acceso irrestricto al hardware, aunque algunos se ejecutan en espacio de usuario. A diferencia de los núcleos monolíticos tradicionales, los controladores de dispositivos y las extensiones al sistema operativo se pueden cargar y descargar fácilmente como módulos, mientras el sistema continúa funcionando sin interrupciones. También, a diferencia de los núcleos monolíticos tradicionales, los controladores pueden ser pre-volcados (detenidos momentáneamente por actividades más importantes) bajo ciertas condiciones. Esta habilidad fue agregada para manejar correctamente interrupciones de hardware, y para mejorar el soporte de Multiprocesamiento Simétrico.

El hecho de que Linux no fue desarrollado siguiendo el diseño de un microkernel (diseño que, en aquella época, era considerado el más apropiado para un núcleo por muchos teóricos informáticos) fue asunto de una famosa y acalorada discusión entre Linus Torvalds y Andy Tanenbaum[3].

A diferencia de los núcleos monolíticos tradicionales, los controladores de dispositivos son fácilmente configurables como Loadable Kernel Modules, y se pueden cargar o descargar mientras se está corriendo el sistema.

Kernel panic

En Linux, un “panic” es un error insalvable del sistema detectado por el kernel en oposición a los errores similares detectados en el código del espacio de usuario. Es posible para el código del kernel indicar estas condiciones mediante una llamada a la función de pánico situada en el archivo header sys/system.h. Sin embargo, la mayoría de los alertas son el resultado de excepciones en el código del kernel que el procesador no puede manejar, como referencias a direcciones de memorias inválidas. Generalmente esto es indicador de la existencia de un bug en algún lugar de la cadena de alerta. También pueden indicar una falla en el hardware como una falla del RAM o errores en las funciones aritméticas en el procesador, o por un error en el soft.

Lenguajes de programación

Linux está escrito con una versión del lenguaje de programación C apoyado por GCC (que ha introducido un número de extensiones y cambios al C estándar), junto a unas pequeñas secciones de código escritas con el lenguaje ensamblador (assembly language). Por la extensión que soporta C, GCC fue durante mucho tiempo el único compilador capaz de construir correctamente Linux. Recientemente, Intel afirmó haber modificado su compilador C de forma de poder compilarlo correctamente.

Se usan muchos otros lenguajes en alguna forma, básicamente en la conexión con el proceso de construcción del kernel (el método a través del cual las bootable image son creadas desde la source). Estos incluyen a Perl, Python y varios lenguajes shell scripting. Algunos drivers también pueden ser escritos en C++, Fortran, u otros lenguajes, pero esto es altamente desaconsejable. El sistema de construcción de Linux oficialmente solo soporta GCC como kernel y compilador de driver.

Portabilidad

Aún cuando Linus Torvalds no ideó originalmente Linux como un sistema Portable, ha evolucionado en esa dirección. Linux es ahora de hecho, uno de los núcleos de sistema operativo más ampliamente portados, y funciona en sistemas muy diversos que van desde iPAQ (una handheld) hasta un zSeries (un mainframe masivo, muy costoso). Está planeado que Linux sea el sistema operativo principal de las nuevas supercomputadoras de IBM, Blue Gene cuando su desarrollo se complete.

De todos modos, es importante notar que los esfuerzos de Torvalds también estaban dirigidos a un tipo diferente de portabilidad. Según su punto de vista, la portabilidad es la habilidad de compilar fácilmente en un sistema aplicaciones de los orígenes más diversos; así, la popularidad original de Linux se debió en parte al poco esfuerzo necesario para tener funcionando las aplicaciones favoritas de todos, ya sean GPL o de Código abierto.

Arquitectura de máquina virtual

El kernel de Linux puede correr sobre muchas arquitecturas de máquina virtual tanto como host del sistema operativo como cliente. La máquina virtual usualmente emula la familia de procesadores Intel x86, aunque en algunos casos también son emulados procesadores de PowerPC o AMD.
Formatos binarios soportados

Linux 1.0 soporta solo el formato binario a.out. La siguiente serie estable (Linux 1.2) agrega soporte para Executable y Linkable Format (ELF), el cual simplifica la creación de librerías compartidas (usadas de forma extensiva por los actuales entornos desktop como KDE y GNOME). ELF es el formato usado por default por el gcc (GNU Compiler Collection) desde alrededor de gcc 2.7.0, a.out actualmente casi no es usado convirtiendo a ELF en el principal formato binario.

Linux soporta muchos otros formatos binarios, incluyendo binfmt_misc para archivos asociados para correr un programa o desplegar dichos archivos.

Versiones

Más allá de haber desarrollado su propio código y de integrar los cambios realizados por otros programas, Linus Torvalds continua lanzando nuevas versiones del núcleo de Linux. Estos son llamados núcleos “vanilla”, lo que significa que no han sido modificados por nadie. Muchos vendedores del sistema operativo Linux modifican el kernel de sus productos, principalmente para agregarle soporte a dispositivos o herramientas que no fueron oficialmente lanzadas como estables, mientras que algunas distribuciones, como Slackware, mantienen el kernel vanilla.

Numeración

La versión del kernel de Linux actualmente consta de cuatro números. Por ejemplo, asumamos que el número de la versión está compuesta de esta forma: A.B.C[.D] (ej.: 2.2.1, 2.4.13 ó 2.6.12.3).

•El número A denota la versión del kernel. Es el que cambia con menor frecuencia y solo lo hace cuando se produce un gran cambio en el código o en el concepto del kernel. Históricamente solo ha sido modificado dos veces: en 1994 (versión 1.0) y en 1996 (versión 2.0).

•El número B denota la mayor revisión del kernel.

Antes de la serie de Linux 2.6.x, los números pares indicaban la versión “estable” lanzada. Por ejemplo una para uso de fabricación, como el 1.2, 2.4 ó 2.6. Los números impares, en cambio, como la serie 2.5.x, son versiones de desarrollo, es decir que no son consideradas de producción.

Comenzando con la serie Linux 2.6.x, no hay gran diferencia entre los números pares o impares con respecto a las nuevas herramientas desarrolladas en la misma serie del kernel. Linus Torvalds dictaminó que este será el modelo en el futuro.

•El número C indica una revisión menor en el kernel. En la forma anterior de versiones con tres números, esto fue cambiado cuando se implementaron en el kernel los parches de seguridad, bugfixes, nuevas características o drivers. Con la nueva política, solo es cambiado cuando se introducen nuevos drivers o características; cambios menores se reflejan en el número D.

•El número D se produjo cuando un grave error, que requiere de un arreglo inmediato, se encontró en el código NFS de la versión 2.6.8. Sin embargo, no habían otros cambios como para lanzar una nueva revisión (la cual hubiera sido 2.6.9). Entonces se lanzó la versión 2.6.8.1, con el error arreglado como único cambio. Con 2.6.11, esto fue adoptado como la nueva política de versiones. Bug-fixes y parches de seguridad son actualmente manejados por el cuarto número dejando los cambios mayores para el número C.

También, algunas veces luego de las versions puede haber algunas letras como “rc1” o “mm2”. El “rc” se refiere a release candidate e indica un lanzamiento no oficial. Otras letras usualmente (pero no siempre) hacen referencia a las iniciales de la persona. Esto indica una bifurcación en el desarrollo del kernel realizado por esa persona, por ejemplo ck se refiere a Con Kolivas, ac a Alan Cox, mientras que mm se refiere a Andrew Morton.

El modelo de desarrollo para Linux 2.6 fue un cambio significativo desde el modelo de desarrollo de Linux 2.5. Previamente existía una rama estable (2.4) donde se habían producido cambios menores y seguros, y una rama inestable (2.5) donde estaban permitidos cambios mayores. Esto significó que los usuarios siempre tenían una versión 2.4 testeada y con lo último en seguridad y bug fixes, aunque tuvieran que esperar por las características de la rama 2.5. La rama 2.5 fue eventualmente declarada estable y renombrada como 2.6. Pero en vez de abrir una rama 2.7 inestable, los desarrolladores de kernels eligieron continuar agregando los cambios en la rama “estable” 2.6. De esta forma no había que seguir manteniendo una rama vieja pero estable y se podía hacer que las nuevas características estuvieran rápidamente disponibles y se pudieran realizar más test con el último código.

Sin embargo, el modelo de desarrollo del nuevo 2.6 también significó que no había una rama estable para aquellos que esperaban seguridad y bug fixes sin necesitar las últimas características. Los arreglos solo estaban en la última versión, así que si un usuario quería una versión con todos los bug fixed conocidos también tendría las últimas características, las cuales no habían sido bien testeadas. Una solución parcial para esto fue la versión ya mencionada de cuatro números (y en 2.6.x.y), la cual significaba lanzamientos puntuales creados por el equipo estable (Greg Kroah-Hartman, Chris Wright, y quizás otros). El equipo estable solo lanzaba updates para el kernel más reciente, sin embargo esto no solucionó el problema del faltante de una serie estable de kernel. Los vendors de la distribución de Linux, como Red Hat y Debian, mantienen los kernels que salen con sus lanzamientos, de forma que una solución para algunas personas es seguir el kernel de una distribución.

Como respuesta a la falta de un kernel estable y de gente que coordinara la colección de bugfixes, en diciembre de 2005 Adrian Bunk anunció que continuaría lanzando kernels 2.6.16.y cuando el equipo estable lanzara 2.6.17. Además pensó en incluir updates de drivers, haciendo que el mantenimiento de la serie 2.6.16 sea muy parecido a las viejas reglas de mantenimiento para las serie estables como 2.4.

Al 30 de abril de 2007 la última versión estable del kernel es 2.6.21.1

Licencia

Inicialmente, Torvalds distribuyó Linux bajo los términos de una licencia que prohibía la explotación comercial. Pero esta licencia fue reemplazada, poco tiempo después, por la GNU GPL (versión 2 exclusivamente). Los términos de esta última licencia permiten la distribución y venta de copias o incluso modificaciones, pero requiere que todas las copias del trabajo original y trabajos de autoría derivados del original sean publicados bajo los mismos términos, y que código fuente siempre pueda obtenerse por el mismo medio que el programa licenciado.

Torvalds se ha referido a haber licenciado Linux bajo la GPL como "lo mejor que he hecho nunca" (en inglés, "the best thing I ever did")[4].


Via: Wiki

No hay comentarios: